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La banca dati LBC 


Annick Farina, Maria Carlota Nicoläs Martinez 


Introduzione 


Il progetto specifico della creazione della Banca Dati LBC ё stato eseguito 
dall’ Unità di ricerca Lessico multilingue dei Beni Culturali che fa capo all Univer- 
sità di Firenze. Uno dei principali scopi dell’Unitä di Ricerca è sviluppare risorse 
e strumenti informatici di supporto per i membri del gruppo di ricerca, con l'in- 
tento di renderli fruibili anche ad altri ricercatori mediante la pubblicazione Open 
Access delle risorse. La Banca Dati permette di effettuare ricerche all'interno di 
corpora testuali nelle diverse lingue del progetto (per ora sei: francese, inglese, ita- 
liano, russo, spagnolo, tedesco) contenenti un numero sufficiente di testi per poter 
mettere a disposizione dati esaurienti. La struttura delle banche dati permette di 
consultarei corpora sulla base di diversi criteri: autore, periodo cronologico, gene- 
re, formato ecc., fornendo informazionilessicali specifiche necessarie nello svolgi- 
mento dei propri lavori dilessicografia e di traduzione. Ora che abbiamo raggiunta 
la fine della prima fase di questo progetto, l’ Unita di ricerca dispone di una piatta- 
forma che consente la consultazione dei corpora e offre informazioni su di essi’. 


1. Cornice del progetto 


Inizialmente il progetto, denominato Informatica Umanistica e multilinguismo: 
sviluppo e divulgazione dei Beni Culturali toscani, si poneva il seguente obiettivo: 


! Consultabile su <http://corpora.lessicobeniculturali.net/>. 


Annick Farina, University of Florence, Italy, annick.farina@unifi.it, 0000-0002-5148-0986 
María Carlota, Nicolás Martínez, University of Florence, Italy, carlota.nicolas@unifi.it, 0000-0001-8350-9811 
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promuovere la realizzazione di studi, di ricerche e di altre attività incentrate sul 

lessico della lingua italiana nell'ambito dei Beni culturali della città di Firenze 

e della Toscana in relazione a varie lingue (cinese, francese, inglese, italiano, 

portoghese, russo, spagnolo, tedesco). Tale ricerca sarebbe stata condotta sulla 

base di corpora originati da testi letterari classici, filosofici, opere scientifiche 

e tecniche, libri di cucina, manuali tecnici, ecc. In tale direzione, l'Unità di ri- 

cerca intendeva, mettendo a frutto le conoscenze nell'ambito sia tecnologico 

sia umanistico, disporre di uno spazio digitale con vari strumenti utili a diffon- 
dere a livello internazionale la conoscenza del patrimonio artistico e culturale 

toscano (Farina 2016). 

Le tipologie di utenti mirati sono: 

e Linguisti, letterati, ricercatori in scienze umane e sociali, il cui lavoro neces- 
sita di ricerche all'interno di vari corpora i cui dati sono strutturati dal si- 
stema in modo tale da ottenere informazioni sullessico per autore, periodo 
cronologico, genere ecc.; 

e Traduttori che hanno necessità di consultare banche dati testuali compara- 
bili o parallele nelle lingue di competenza? e risorse lessicali specifiche ba- 
sate su testi della stessa specialità/tipologia di quelli che devono tradurre; 

e Specialisti del settore turistico, quali guide, agenzie turistiche, ristoratori 
ecc., che intendono presentare il patrimonio culturale a persone provenienti 
da varie nazioni, attraverso ad es. il legame tra una citazione e un luogo, per- 
mettendo di arricchire la scoperta turistica con informazioni che non sono 
immediatamente percepibili visitando un luogo; 

e  Turistiinteressati ad approfondire la propria conoscenza del territorio e della 
cultura legata ad esso, che potrebbero consultare informazioni su vari luoghi 
e autori, su artisti che ne hanno parlato o che ci sono vissuti, realizzando la 
propria visita 'accompagnati' dai più noti turisti dei secoli passati, es. Una- 
muno, Stendhal, Lawrence ecc. 


Frutto del progetto dovevano essere strumenti digitali necessari alla gestio- 
ne delle fonti primarie. 

Dal 2016 l'Unità di Ricerca si è progressivamente concentrata sulla creazione 
diuna banca dati formata da corpora in diverse lingue con testi storico-artistici 
e/o letterari. Questo progetto é stato possibile anche grazie alla collaborazione 
con un ricercatore formato in Digital Humanities con il quale si é realizzato uno 
scambio di know how tra due discipline diverse (la linguistica e l'informatica), 
creando nel corso della collaborazione gli strumenti necessari a linguisti, lette- 
rati e ricercatori, progettando e garantendo al tempo stesso la possibile espan- 
sione del progetto verso le altre tipologie di utenti previste. 

Il progetto nella sua primafase ha potuto disporre di alcune importanti colla- 
borazioni con università e/o enti su base internazionale, tra le quali il Laboratoi- 


> A proposito della futura implementazione di corpora paralleli per il nostro progetto, cfr. 
Zotti 2017. 
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re d'Informatique dell’ Universita di Tours (Francia), il Laboratorio UMR 5206 
“Triangle” del francese Centre national de la recherche scientifique, il gruppo 
LiCoRN della Université de Bretagne Sud, CHIMERA Romance Corpora and 
Linguistics Studies (Universidad Autönoma de Madrid). 


2. La banca dati LBC 


La prima fase del progetto é consistita nella creazione della banca dati del- 


le diverse lingue con testi storico-artistici e/o letterari su Firenze e la Toscana. 


Gli obiettivi programmati in questa fase di lavoro sui corpora sono stati i 


seguenti’: 


creare corpora testuali nelle varie lingue del progetto con la massima omo- 
geneità possibile per permettere la loro comparabilità; 

predisporre gli strumenti necessari per la strutturazione dei dati riguardanti 
la gestione bibliografica delle fonti prevedendo il collegamento fra testi in- 
seriti in più corpora (testi tradotti); 

definire le modalità di ricerca delle fonti (digitali e cartacee); 

definire il tipo di conversione OCR dei testi secondo il loro formato; 
adeguare il formato dei testi al loro uso all'interno dei corpora anticipando 
i futuri tipi di uso sia documentario sia lessicografico; 

scegliere un software di gestione con funzioni adeguate all utenza e agli svi- 
luppi mirati (fra cui creazione dilemmari, concordanze e liste di frequenze) 
e strutturato per agevolarne la gestione a vari livelli, in particolare per quan- 
to riguarda l'estrazione di informazioni lessicografiche nelle diverse lingue. 
programmare uno spazio digitale in cui alloggiare i corpora e i metadati con 
l'idea di diffondere strumenti utili alla ricerca a livello internazionale, met- 
tendo a frutto le attuali conoscenze in ambito sia tecnologico sia umanistico; 
diffondere questi strumenti tramite il sito dell Unita di ricerca? già disponi- 
bile in Open Access. 


Partendo da questi obiettivi si é progettato lo svolgimento delle seguenti 


azioni: 


5 


concordare tra tutti i ricercatori delle varie lingue le tipologie di testi da in- 
serire nel corpus, prevedendo anche la realizzazione di corpora paralleli fra 
le varie lingue del progetto e riservando, dunque, una parte cospicua ad ope- 
re di cui esistono traduzioni nelle varie lingue del progetto prestando atten- 
zione alla loro qualita‘; 


Ctr. Billero, Nicolás 2017 per una descrizione piü dettagliata. 

Nel 2015 l’Unità firmò un contratto di edizione con la Firenze University Press per la pub- 
blicazione del Portale digitale "Lessico per i Beni Culturali", che é consultabile on-line 
<http://www.lessicobeniculturali.net> nelle versioni delle diverse lingue previste dal pro- 
getto (cinese, francese, inglese, italiano, portoghese, russo, spagnolo, tedesco). La pubblica- 
zione é stata implementata dal Partner tecnologico: Progettinrete S.r.l. 


Per il processo di verifica di qualità semi-automatizzato cfr. Farina, Billero 2018. 
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e definire la macrostruttura della banca dati e delle subcategorie (tipologie te- 
stuali, traduzione/lingua originale ecc.); 

e determinare le specifiche per l'etichettatura dei testi digitalizzati; 

e coordinare e validare la digitalizzazione del materiale testuale; 

e realizzare un software on line, la cui interfaccia sia accessibile inizialmente 
ai soli membri dell’unità di ricerca e che consenta la consultazione dei sud- 
detti corpora, in ogni lingua o in diverse lingue contemporaneamente, sulla 
base dei risultati già ottenuti dalla Umanistica Digitale; 

e svolgere incontri formativi destinati ai membri del gruppo LBC e ai tiroci- 
nanti al fine di fornire le competenze necessarie per creare i corpora e per 
utilizzare il software di gestione implementato; 

e svolgere Workshop e riunioni di lavoro periodici per verificare l'andamento 
dei lavori, individuare problemi e per scambi di know-how anche con specia- 
listi invitati esterni al gruppo; 

e presentare e pubblicare i risultati ottenuti nelle varie fasi del progetto in con- 
ferenze e/o riviste specialistiche nazionali e internazionali dando modo al 
tempo stesso sia di ottenere dalla comunità scientifica riscontri in merito, sia 
di comunicare ad essa eventuali innovazioni derivanti dal progetto stesso. 


3. | corpora LBC: fasi specifiche del lavoro 
3.1 Creazione delle bibliografie di testi da inserire nei corpora 


E stata realizzata una bibliografia di testi di interesse (corrispondenti per 
tematica e genere a quelli dell'intero progetto) relativi ad ogni lingua con due 
criteri di priorità per i testi in lingua originale: autorità riconosciuta del testo/ 
autore nella cultura di appartenenza e diffusione$; facilità di conversione in for- 
mato Word, evitando testi di difficile digitalizzazione. Questi criteri si sono poi 
concretizzati in ulteriori passaggi: é stato redatto un elenco di testi fondamen- 
tali in italiano e in altre lingue, primordiali per la conoscenza a livello interna- 
zionale del patrimonio artistico-culturale toscano che sarebbe servito come 
punto di partenza in tutte le lingue per la ricerca di possibili traduzioni. Sicco- 
me la lingua di partenza è l’italiano, si è concordato prima di tutto una lista di 
testi di base di Storia dell'Arte essenziali e riferiti alla Toscana, concretamente: 
Le vite del Vasari, i libri di architettura di Alberti, Palladio, Sellio, alcuni scrit- 
ti di Machiavelli e di Leonardo. Oltre a questi, ogni lingua ha considerato libri 
di viaggio di nota fama, come i viaggi in Toscana di Stendhal e Ruskin, e libri 
d'arte come il Burckhardt. 


«I criteri di selezione dei testi sono stati: la rilevanza storico-culturale dell'opera dell'am- 
bito specifico di studio (ad es. testi di Vitruvio o Leonardo); la diffusione internazionale 
di un'opera relazionata con l'ambito di studio (es. libri di Vasari); il prestigio dato a livello 
internazionale al patrimonio italiano da parte di un'opera (es. testi di Stendhal o Ruskin); 
la specificità dell'argomento in rapporto alla storia dell'arte italiana, e in particolare della 
Toscana (es. Burckhardt)» (Billero, Nicolás 2017: 208). 
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La scelta delle diverse tipologie di testo & stata concordata fra i vari gruppi 
di lavoro, aprendo un dibattito legato alla decisione dei testi da introdurre ma 
anche alla classificazione delle tipologie testuali. Un punto, per esempio, che ha 
richiesto una lunga riflessione riguarda la categorizzazione delle Vite di Vasari 
come testo tecnico, poiché si tratta di un testo caratterizzato dalla compresen- 
za di stili diversi e dunque attribuibile a generi testuali diversi". La decisione di 
classificarlo come testo tecnico si basa sulla constatazione che le Vite & un testo 
di riferimento non solo per gli storici dell'arte ma anche per chi si interessa del- 
le tecniche artistiche del periodo rinascimentale. 

Anche la classificazione di testi epistolari nella categoria "Letterario-Bio- 
grafico" é stata oggetto di discussione: le prime corrispondenze introdotte nei 
corpora sono state quelle di viaggiatori del Grand Tour francese in uno stile 
molto simile a quello dei quaderni di viaggio, si é quindi pensato di inserir- 
li nella stessa categoria. Diversamente, nelle corrispondenze di artisti come 
quella di Michelangelo, stile e contenuto sono molto diversi. Si é quindi pen- 
sato di creare una categoria apposita, "Documentario", contenente la sotto- 
categoria epistolare. Questa possibilità sarà valutata per l'estensione futura 
della banca dati testuali. 

Non abbiamo comunque definito nella prima fase la priorità e proporzione 
da dare ad ogni tipologia nei diversi corpora: i criteri sopra descritti rendevano 
la scelta dipendente dalle specificità di ogni lingua/cultura e del tipo di risorse 
facilmente reperibili nei vari Paesi. Infatti, se l'Italia & stata meta di numerosi 
viaggiatori del Grand Tour, il percorso é diverso in base alla nazionalità dei viag- 
giatori e non comprende per forza la Toscana, inoltre i loro resoconti di viaggio 
non sono stati pubblicati nella stessa proporzione. L interesse per l'arte rina- 
scimentale italiana non si é sviluppato negli stessi periodi nelle varie nazioni e 
non ha dato luogo alla stessa quantità di opere critiche. Da queste osservazioni 
deriva una eterogeneità fra corpora che vorremmo limitare negli sviluppi futuri 
del progetto. Infatti l'analisi della distribuzione delle tipologie di testi scelti in 
ogni corpus e dei secoli rappresentati alla fine di questa prima fase di costitu- 
zione dei corpora potrà permettere una più ampia omogeneizzazione in futuro, 
consentendo lavori di comparazione dei testi. Nella prima fase la priorità data 


«L'opera nel suo complesso comprende, oltre alla descrizione delle vite degli artisti, un ap- 
parato testuale di cornice costituito dalla Dedica a Cosimo I de' Medici e dal Proemio, de- 
finibili come microtesti appartenenti a generi testuali differenti da quello biografico, con 
funzione appellativa e stile argomentativo. Anche le stesse singole Vite non sono ricondu- 
cibili esclusivamente al genere della biografia, ma presentano in linea di massima tre nuclei 
tematici, ognuno caratterizzato dalla predominanza di uno stile peculiare: nella parte ini- 
ziale, in cui si descrivono l'infanzia e la vita dell'artista, predomina il carattere biografico e 
lo stile è descrittivo-narrativo [...]. Nella parte centrale si ha la descrizione dei viaggi e delle 
opere dell'artista fino alla sua morte. In essa predomina il carattere artistico-storiografico e 
lo stile è descrittivo-esplicativo [...] Nella parte finale si annoverano i discepoli e sono nar- 
rati aneddoti sulla vita dell'artista: qui emerge nuovamente il tratto biografico, arricchito 
peró di elementi narrativi come dialoghi e poetici come parti in versi, spesso citate da altri 
autori» (Ballestracci 2018: 22-23). 
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all’inserimento di testi di riferimento della propria lingua e/o di facile conver- 
sione ha permesso di ottenere una base di testi consistente e sufficiente per ri- 
cerche in un'unica lingua*. 


3.2 Creazione degli strumenti necessari alla gestione delle fonti 


3.2.1 Condivisione delle cartelle 


Per consentire la corretta gestione del flusso di lavoro? si sono stabilite del- 
le fasi, che sono state seguite in ogni lingua, facilitate dalla creazione di cartel- 
le condivise dai responsabili del lavoro di ogni lingua e dell'informatico. In un 
primo momento sono state create in Dropbox e successivamente in un Cloud 
(Figura 1). Questo sistema ha facilitato enormemente il controllo e il processo 
dellavoro. Nelle cartelle venivano di volta in volta inseriti sia i risultati sia le in- 
formazioni sui compiti da svolgere/svolti in ogni tappa del lavoro. 


AccettatiDefinitiv 
nPulitura 


# ES-S ElaborazioneBancaDati 


g 
o 
O 
Es] 


Scansioni 


Tirocin 


TraduzioniErrate 


Bibliografia-ES 


Figura 1. Cartelle Cloud del corpus spagnolo. 


Per i testi in versione cartacea si é proceduto alla scannerizzazione, inse- 
rendo la versione in PDF nella cartella Scansioni. Finito questo lavoro, si sono 
trasferiti i testi scansionati nella cartella OCR insieme ai testi già disponibi- 


$ Di fatto, i membri del gruppo di lingue diverse hanno già cominciato studi comparativi fra 
corpora o sotto-corpora LBC che potranno essere utili in fase di bilanciamento dei corpora. 
Citiamo ad esempio Farina, Flinz 2020 per la comparazione fra francese e tedesco. 


? Cfr. ВШего 2020 per una descrizione più dettagliata del flusso di lavoro. 
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li in versione PDF (principalmente testi liberi da diritti d’autore disponibili 
nelle biblioteche in rete). Da questa cartella l’informatico ha proceduto alla 
trasformazione dei PDF in formato Word. 

I testi in Word sono stati messi nella cartella InPulitura e sono stati di- 
stribuiti fra i membri del gruppo о consegnati agli studenti che effettuava- 
no i tirocini per l'unità di ricerca. La scrupolosa verifica di un testo in una 
lingua studiata dagli studenti comparandolo con la versione originale PDF, 
eliminando gli errori creati nella conversione tramite OCR ci é parsa mol- 
to formativa, e ha costituito perció la parte principale dei tirocini svolti 
all'interno del gruppo. Tutti i tirocini comprendevano comunque l'acqui- 
sizione di savoir-faire che riguardava l'insieme del processo legato alla crea- 
zione delle banche dati. Nella cartella Tirocini, il responsabile del tirocinio 
raccoglieva i testi 'puliti' che necessitavano di un secondo controllo prima 
di passare alla cartella AccettatiDefinitivi, contenente i testi revisionati dai 
membri del gruppo. 

Itesti sono stati spogliati di tutto ció che non era testo, di tutti gli elemen- 
ti paratestuali e delle formattazioni dovute all'edizione (intestazioni e pie di 
pagina, numeri di pagina, illustrazioni, bibliografie ecc.). Si sono mantenute 
a parte le note originali nel testo distinguendo le note degli autori da quelle 
di traduttori o editori con etichette (nda/ndt/nde), ma sono state eliminate in 
fase di introduzione dei testi nel software di gestione dei corpora per evitare 
errori di datazione e di paternità. 


3.2.2 Creazione della macrostruttura dei corpora 


Nel disegno del corpus si sono seguite regole tradizionali rispettando cri- 
teri condivisi da tutti i membri del gruppo per la gestione dei metadati quali: 
• lingua: è inserita sia la lingua del testo sia la lingua di origine рег i testi in 

traduzione; 

e informazione cronologica: differenziazione tra data di redazione dei testi 
(laddove possibile) e data di edizione; per i testi tradotti sono state inserite 
le stesse informazioni sia sul testo di origine che sul testo tradotto". In caso 
di datazioni poco chiare è stata aggiunta l’etichetta “Ipotesi”. Per le pubbli- 
cazioni online viene indicata la data di consultazione; 

e tipologia di testo: tuttii testi hanno come argomento il patrimonio artistico 
e il suo lessico, e in particolare un’ampia visione di Firenze e della Toscana 
descritta da diversi punti di vista. Sono state individuate quattro macrocate- 
gorie (Divulgativo, Tecnico, Dizionario e Letterario) e le loro relative sottoca- 


? Ttesticontenutivanno dal Rinascimento ai giorni nostri. Sebbene siano presenti entrambe le 
datazioni, l'anno di pubblicazione è secondario rispetto a quello di redazione. Quest'ultimo, 
infatti, è il dato di maggiore interesse per l'estrazione di informazioni, poiché rappresentati- 
vo delle caratteristiche linguistiche del periodo considerato; infatti, i testi sono stati inseriti 
nella banca dati rimanendo fedeli all’edizione usata, senza produrre alcun tipo di moderniz- 
zazione o di correzione ortografica. 
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tegorie (Divulgativo: Blog, Guida, Ricettario, Rivista; Tecnico: Architettura, 
Arte, Edilizia, Enogastronomia, Storia; Letterario: Biografico, Fiction, Sag- 
gistica; Dizionario: Monolingue, Bilingue/plurilingue). Si & tenuto conto 
per individuare queste categorie della destinazione principale dell’opera e 
del tipo di lettore a cui è rivolta, dati che condizionano il tipo di lingua usata 
e il suo livello di specializzazione; 

autore: sono indicati cognome e nome e l'indicazione "sa" (senza autore) 
quando inesistente; 

nome del traduttore: quando reperibile, si indica il nome del traduttore; 
titolo e sottotitolo: si è scelto l'introduzione sia di testi interi sia di frammenti 
che corrispondono ad un'unità testuale perché provvisti di titoli, quali capi- 
tolo di libro, lettera completa, articolo di rivista ecc. Tale scelta é stata effet- 
tuata poiché in molti casi l'intero libro non coincideva con gli interessi del 
progetto ma anche per facilitare la futura realizzazione di versioni in paral- 
lelo di testi tradotti". Per i testi tradotti sono stati inseriti sia titoli originali 
sia titoli tradotti; 

informazione editoriale: si indica nome editore e luogo di edizione; 
delimitazione geografica: per testi che hanno come oggetto una città o re- 
gione definita si é inserito il nome della città o regione. Questa indicazione é 
presente principalmente per i libri di viaggio e per le corrispondenze. 


Conitesti definitivi pronti sié proceduto alla schedatura del testo e alla crea- 


zione di metadati condivisi da tutte le lingue. 


Per questa fase di compilazione dei metadati si é usato una struttura infor- 


matica creata su Excel per poter estrarre successivamente l'informazione (Fi- 


gu 


ra 2). La prima informazione generata automaticamente usando questi dati 


é il nome di ogni file di testo da cui si possono ricavare in modo immediato le 
principali informazioni sul testo". 
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Abbiamo notato che molte traduzioni dei testi ritenuti da noi essenziali perla conoscenza del 
patrimonio toscano quali ad esempio Le Vite di Vasari o la corrispondenza di Michelangelo 
non hanno sempre traduzioni integrali nelle varie lingue. La divisione di queste opere nei 
singoli frammenti permette di mettere in parallelo testi originali e traduzioni anche nel caso 
di traduzioni parziali. 

П nome del file fr-FR LET bio Bros LetFam LetXXIV 1739г 1858р, ad esempio, cor- 
risponde all'informazione: Lingua Originale: Francese (Francia), Categoria e sottocatego- 
ria: Letterario-Biografico; Autore: Brosses, Charles de; Titolo: Lettres familiéres écrites d’I- 
talie а quelques amis, en 1739 et 1740, avec une étude littéraire et des notes par Hippolyte 
Babou; Frammento: Lettre XXIV AM. De Quentin. Mémoire sur Florence; Anno di reda- 
zione: 1739; Info anno di redazione: Redazione; Anno di pubblicazione: 1858; Info anno 
di pubblicazione: Pubblicazione. Il nome del file (testo in traduzione) it TEC art Vas - 
VitGiu Gio 1568r 1966p fr-FR 1839t 1839p corrisponde invece a: Lingua originale: 
Italiano; Lingua di traduzione: Francese (Francia); Categoria e sottocategoria: Tecnico- 
Arte; Autore: Vasari, Giorgio; Titolo: Vite de’ più eccellenti pittori scultori e architettori; 
Frammento: Vita di Giotto, pittore, scultore e architetto fiorentino; Anno di redazione: 
1568; Info anno di redazione: Redazione; Anno di pubblicazione: 1966; Info anno di pub- 
blicazione: Pubblicazione; Titolo traduzione: Vies des peintres, sculpteurs et architectes; 
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Figura 2. Foglio Excel metadati corpus spagnolo. 


3.3 Spazio digitale: Decisioni sul software da usare per generare i corpora'? 


Si é quindi proceduto ad effettuare una ricerca sullo stato dell'arte delle 
tecnologie esistenti all'interno dell'Informatica Umanistica utili ai nostri fi- 
ni. Dopo varie discussioni, si é ritenuto opportuno utilizzare una installazio- 
ne di NoSketchEngine su un server per uso interno permettendo ricerche di 
concordanze anche inserendo filtri in base a varie caratteristiche, quali autore, 
periodo storico, tipologia testuale ecc. (Figura 3). 

Il processo dilemmatizzazione ha comportato molte difficoltà in tutte 
le lingue per ragioni diverse. In lingue come il russo, per esempio, per la 
complessità derivativa; per altre lingue, come ad esempio francese e spa- 
gnolo, la presenza di testi non contemporanei ha generato errori di ricono- 
scimento; anche la presenza di molti prestiti non lessicalizzati o citazioni 
in lingua straniera hanno falsato il riconoscimento dei lemmi. Queste pro- 
blematiche peculiari di ogni lingua sono descritte nella presentazione dei 
singoli corpora. 


3.4 Pubblicazione dei corpora 


La struttura della banca dati iniziale condivisa ha portato alla pubblicazione 
dei corpora nella piattaforma dell’Unità di ricerca LBC. La condizione proposta 
per poter pubblicare un corpus era di raggiungere un minimo di 1.000.000 di 
parole. Le lingue del progetto che hanno già raggiunto questa soglia sono l'in- 
glese, l' italiano, il francese, lo spagnolo, il russo e il tedesco. Si può attingere al- 
le informazioni sulla natura dei contenuti di ogni corpus accedendo alla parte 
"Corpus info" disponibile nel menu di NoSketchEngine (Figura 4). 


Frammento traduzione: Giotto; Anno di redazione traduzione: 1839; Info anno di redazione 
traduzione: Traduzione; Anno di pubblicazione traduzione: 1839; Info anno di pubblicazio- 
ne traduzione: Pubblicazione. 

Questa parte é descritta in modo dettagliato nell'introduzione di Riccardo Billero presente 
in questo volume. 
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Corpus: [Corpus LBC Tedesco v 


Simple query: |loggia Make Concordance 
Query types Context Text types Ө 


Text types 
Subcorpus: | None (whole corpus) y |info create new © 


LINGUA ORIGINALE 


(О Francese (Francia) 
О Inglese (Regno Unito) 
(О Italiano 

О Tedesco (Germania) 


Select All 


LINGUA DI TRADUZIONE 
О Tedesco (Germania) 


Select All 


CATEGORIA E SOTTOCATEGORIA 


® [O Divulgativo 
® U letterario 
® О Tecnico 


Select All 


AUTORE 


la 


Vasari, Giorgio 

Artusi, Pellegrino 
Machiavelli, Niccolò 
Burckhardt, Jacob 

Rilke, Rainer Maria 

Gass, Karl Eugen 
Ciccarelli, Jepson, Fisher 
da Vinci, Leonardo 
Stendhal 

Moritz, Karl Philip 
Goethe, Johann Wolfgang von 
Lewald, Fanny 

Brandi, Karl 


Figura 3. Ricerca con text type su corpus tedesco. 


Corpus LBC Francese 


Counts General info Lexicon sizes 
Tokens 3,818,747 Corpus description Document word 99,715 
Words 3,164,995 Language French tag 34 
Paragraphs 37,464 Encoding UTF-8 — lemma 25,673 
Documents 252 Compiled 11/12/2019 11:04:35 — lc 88,549 
Tagset Description lemma_lc@ 25,403 


Structures and attributes 
doc 252 И 


Subcorpora statistics 


Subcorpus Tokens Words % 

DIVBlog 32,613 ~ 27,029 0.85 
DIVGuida 334,433 = 277,179 8.75 
DIVRivista 50,604 ~ 41,940 1.32 
DiZMono 850,167 - 704,622 22.26 
LETBio 884,995 - 733,487 23.17 
LETFic 632,831 - 524,493 16.57 
LETSag 710,938 - 589,228 18.61 


LinguaOriginale 3,515,483 ~ 2,913,648 92.05 
LinguaTraduzione 303,262 251,344 7.94 
TECArc 29,308 - 24,290 0.76 
TECArt 292,468 - 242,398 7.65 


Figura 4. Informazione dettagliata sul corpus francese disponibile su “Corpus info”. 
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4. Conclusioni 


La realizzazione di questa prima fase dei nostri corpora ё da ritenere soddi- 
sfacente in quanto ha creato le basi necessarie peri primi lavori e perle ricerche 
del nostro gruppo (Carpi 2016; Ballestracci 2018; Lanini, Nicolás 2018; Farina, 
Frinz 2020). Sono stati già realizzati i primi lemmari di ogni lingua corredati 
di concordanze estratte dai corpora che verranno pubblicate sulla piattaforma 
e potranno essere usate per l'elaborazione di futuri dizionari. 

Questo primo lavoro realizzato da ognigruppo avevaloscopo divalidareicorpo- 
ranella prospettiva diidentificare problemi che emergono solo dal loro uso effettivo. 

Nel futuro si pensa di ampliare sia il numero di lingue (mancano ancorai corpora 
di cinese, portoghese e turco) sia quello dei testi conl’idea di omogeneizzazione già 
descritta, per cercare di rendere i corpora quanto più possibile comparabili fra loro. 
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Implementazione di software per la gestione dei 
corpora LBC 


Riccardo Billero 


Introduzione 


L'importanza del lessico dei beni culturali italiani va ben oltre i confini del- 
le comunità linguistiche ed é oggetto di interesse per studiosi afferenti a diver- 
se discipline (come storia dell'arte, letteratura, linguistica), per i professionisti 
(traduttori, guide turistiche, organizzatori di eventi) e per gli studenti di tali 
discipline. Attraverso l'utilizzo delle moderne tecnologie messe a disposizione 
dall'Informatica Umanistica, l'Unità di Ricerca "Lessico multilingue dei Be- 
ni Culturali" (LBC) si pone l'obiettivo di creare strumenti utili per i soggetti 
summenzionati, concentrandosi sull'arte di Firenze e della Toscana. Tra tali 
strumenti rivestono particolare importanza i sei corpora LBC, liberamente di- 
sponibili online, la cui creazione é descritta nel seguito. 


1. Informatica Umanistica e Lessico dei Beni Culturali 


L'Informatica Umanistica é un campo di studio in continua evoluzione, di 
cui esistono molteplici definizioni, alcune più orientate verso le tecnologie e le 
metodologie di indagine, altre verso l'innovazione dei contenuti e dei program- 
mi di ricerca all'interno degli studi umanistici, mediante l'ausilio delle nuove 
tecnologie (Numerico, Vespignani 2003: 13-14). Per Svensson (2010) si tratta 
fondamentalmente dell'intersezione tra le scienze umanistiche e le tecnologie 
dell'informazione; ad oggi «si privilegia il concetto di digital humanities per ri- 
ferirsi a una realtà più vasta che riguarda non solo le metodologie di costituzione 


Riccardo Billero, University of Florence, Italy, riccardo.billero@unifi.it, 0000-0002-6099-222X 
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di corpora е di annotazione di testi, nonché l’elaborazione di programmi atti a 
leggere i dati raccolti in essi, ma anche la realizzazione di applicazioni pensate 
per poter funzionare su diversi dispositivi elettronici, utili sia alla visualizzazio- 
ne, fruizione e condivisione di enormi quantità di dati, che all'interpretazione 
semantica degli stessi da parte dei computer, per menzionare solo alcune possi- 
bilità» (Zotti, Pano Alamán 2017: 8). 

Qualunque sia la definizione che preferiamo adottare, possiamo comunque 
affermare che l'incontro tra l'informatica e le scienze umane offre alle nuove 
generazioni di ricercatori, docenti e studenti un modo nuovo di avvicinarsi alla 
cultura, mediante l'uso degli strumenti messi oggi a disposizione delle tecno- 
logie contemporanee. 

In questa ottica intendiamo qui descrivere il contributo che il progetto Les- 
sico dei Beni Culturali ha ricevuto dall'Informatica Umanistica grazie al lavo- 
ro dell'autore. 

Il progetto Lessico multilingue dei Beni Culturali (in breve LBC) & attivo 
da diversi anni presso l'omonima Unità di Ricerca con sede nel Dipartimento 
di Formazione, Lingue, Intercultura, Letterature e Psicologia (FORLILPSI) 
dell'Università degli Studi di Firenze (Billero, Nicolás Martínez 2017; Billero 
2020) e si pone gli obiettivi di: 

a. creare una piattaforma web di riferimento utile allo studio del lessico dei 
beni culturali; 

creare dei corpora di riferimento per ognuna delle lingue coinvolte nel progetto'; 
c. fornire l’accesso a tali corpora e degli strumenti utili perla ricerca al loro in- 

terno, al fine di abilitare e promuovere studi in settori quali linguistica, les- 

sicografia o ambiti socioculturali. 
d. creare un dizionario multilingue dei termini artistici che utilizzi i corpora 
come riferimento. 


Attualmente, le risorse principali del progetto LBC sono sei corpora conte- 
nenti una raccolta di testi in varie lingue (come di seguito descritto) e sei lem- 
mari relativi al linguaggio dell'arte, estratti dai corpora per ciascuna lingua e 
successivamente elaborati dai membri dei gruppi linguistici coinvolti nel pro- 
getto. Nel seguito saranno descritti in particolare i corpora LBC ed il relativo 
processo di creazione. 


2. | corpora LBC 


IcorporaLBC sonouna delle principali risorse dell’Unitä di Ricerca “Lessico 
multilingue dei Beni Culturali". Fin dall'inizio dei lavori (nel 2016), ё stato pre- 
visto che i corpora LBC sarebbero stati utilizzati non solo dai membri dell’ Unità 


! А1 тотепќо le lingue coinvolte nel progetto sono: cinese, francese, inglese, italiano, porto- 


ghese, russo, spagnolo, tedesco, turco. 
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di Ricerca LBC? nella fase di implementazione del dizionario, ma anche da altri 

utenti, quali ad es. traduttori e specialisti in storia dell'arte italiana. 
In considerazione di ció, i corpora LBC sono stati progettati per avere un 

ampio uso specialistico, con i seguenti requisiti di base: 

a. disporre di materiale linguistico utile per creare e documentare future voci 
del dizionario multilingue LBC; 

b. disporre di materiale linguistico utile per svolgere studi linguistici, lettera- 
li o culturali; 

c. includere testi che sensibilizzino il grande pubblico al patrimonio culturale 
di Firenze e della Toscana. 


Per la creazione dei corpora LBC, abbiamo considerato testi scritti dal Ri- 
nascimento ai giorni nostri ed aventi per soggetto il patrimonio culturale e, in 
particolare, una visione di Firenze o della Toscana descritta da diversi punti di 
vista, sia oggettivi che personali. L'ambito geografico cambierà in futuro, per 
coprire l’intera Italia e altre culture. Traitesti inseriti all’interno dei nostri cor- 
pora, possiamo enumerare: 
biografie, es. Cellini, La vita o Dumas, Une année a Florence; 
testi di arte, es. Vasari, Le Vite o Alarcön, Vidas de los pintores y estatuarios; 
romanzi, es. Forster, A Room with a View; 
saggi, es. Feuillet, L'art italien o Burckhardt, Geschichte der Renaissance; 
guide turistiche, es. Routard, GeoGuide; 
dizionari specialistici, es. Viollet Le Duc, Dictionnaire de l'architecture. 


норо sp 


Per ognuno dei testi presenti nei corpora sono memorizzati sia l’anno di re- 
dazione che l’anno di pubblicazione, con quest’ultimo considerato secondario 
rispetto al primo. In effetti, l’anno di redazione sarà il dato di fondamentale 
importanza per l’estrazione delle informazioni, poiché è in qualche modo rap- 
presentativo delle caratteristiche linguistiche del periodo in esame; infatti i te- 
sti sono stati inseriti in tutti i corpora rimanendo fedeli all’edizione utilizzata, 
senza produrre alcun tipo di modernizzazione. 

Va sottolineato che all’interno dei nostri corpora sono stati inclusi sia libri 
interi che frammenti ‘auto-conclusivi’ (come un capitolo di un libro, un artico- 
lo di una rivista); questa scelta è stata fatta perché in molti casi i contenuti dei 
libri nella loro interezza non sempre coincidevano con gli interessi del progetto. 

È stato svolto un lavoro preliminare per determinare le categorie da utilizza- 
re per catalogare i testi, a seconda dei generi testuali inclusi nei corpora. Innan- 
zitutto abbiamo differenziato i testi tecnici da quelli informativi, soprattutto in 
base al target di riferimento, ovvero se il destinatario è o meno uno specialista. 
La terza categoria individuata è quella dei dizionari, che sono da considerarsi 
testi tecnici nel nostro campo di interesse. Infine, è stato inserito il genere lette- 


?^ Esempi di utilizzo possono essere trovati in Carpi 2017; Farina, Billero 2018; Billero, Carpi 
2018; Lanini, Nicolás 2018; Garzaniti 2020; Farina, Frinz 2020. 
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rario in quanto si rivela utile per fornire una visione di Firenze e della Toscana, 
esprimendo come il suo patrimonio & percepito da un punto di vista esterno. In 
dettaglio, sono state individuate le seguenti categorie e sottocategorie: 
Divulgativo - Blog 

Divulgativo - Guida 

Divulgativo - Ricettario 

Divulgativo - Rivista 

Tecnico - Architettura 

Tecnico - Arte 

Tecnico - Edilizia 

Tecnico - Enogastronomia 

. Tecnico - Storia 

10. Letterario — Biografico 

11. Letterario — Fiction 

12.Letterario – Saggistica 

13. Dizionario - Monolingue 

14. Dizionario — Multilingue 


CENTER 


La suddetta classificazione si & rivelata finora efficace, tuttavia occorre sot- 
tolineare che é ancora provvisoria, come notano gli stessi membri dell'Unità 
di Ricerca, e potrebbe essere soggetta a revisioni nelle successive fasi di lavoro. 


3. Il flusso di lavoro per la creazione dei corpora 


E stato creato un flusso di lavoro adeguato alla generazione dei corpora LBC 
che ha permesso di eseguire tutti i passaggi necessari ad ottenere corpora con- 
sultabili online partendo da un semplice elenco di testi da utilizzare. 

Le responsabilità per l'esecuzione di tale flusso di lavoro sono suddivise nel 
modo seguente: 

1. Il processo di selezione, digitalizzazione e raccolta dei testi (con relativi me- 
tadati) dainserire nei corpora è curato dai responsabili dei gruppi linguistici; 
2. LagestioneIT dell'intero progetto LBC era invece sotto la nostra responsabilità. 


Le due aree di responsabilità sono essenzialmente indipendenti l'una dall’al- 
tra, o più correttamente vengono svolte in momenti diversi. Naturalmente, va 
notato che la seconda richiede i risultati della prima come dati in input. Le due 
sezioni seguenti illustreranno le due diverse aree delineate sopra, concentran- 
dosi in particolare sugli aspetti tecnici e informatici. 


4. La raccolta dei testi 


Il flusso dilavoro relativo al processo di selezione, digitalizzazione e raccolta 
dei testi (con relativi metadati) da inserire nei corpora & stato condotto dai di- 
versi gruppi linguistici, uno per ogni lingua inclusa nel progetto (Farina 2016). 
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In primo luogo, ogni gruppo ha compilato una bibliografia di testi (scritti 
nella relativa lingua di riferimento) aventi come tema il patrimonio culturale 
di Firenze e della Toscana. In particolare occorre osservare che il gruppo di la- 
voro di lingua italiana ha condotto una ricerca al fine di creare una bibliografia 
dei testi più importanti che dovevano essere inclusi nei corpora, i cosiddetti 'te- 
sti fondatori’; tali testi sono considerati rilevanti o per la loro terminologia ar- 
tistica (l'arte italiana è un punto di riferimento per la storia dell'arte) o perché 
sono classici dell'arte italiana (come Vasari o Michelangelo) che hanno come 
oggetto Firenze. 

Successivamente, ogni gruppo ha individuato le traduzioni di questi testi e 
ha cercato di identificare altri testi, nella propria lingua, aventi come soggetto 
l'arte a Firenze o in Toscana, cioè libri di viaggiatori di passaggio a Firenze (es. 
Geschichte der Renaissance di Burckhardt). 

Al fine di consentire l’accesso ai file a tuttii membri dell’ Unità di Ricerca, si è 
deciso di utilizzare una soluzione di archiviazione dati su cloud, basata dapprima 
su cartelle Dropbox, una per ognilingua coinvolta nel progetto. I responsabili dei 
diversi gruppi linguistici hanno avuto accesso ai propri dati in modalità di lettura 
e scrittura, accedendo invece ai dati delle altre lingue in modalità di sola lettura. 

Dropbox é stato inizialmente scelto per i suoi vantaggi, come la facilità del- 
la configurazione iniziale (da parte del responsabile IT) e la facilità d'uso per 
tuttii membri del gruppo. In un secondo momento, sia perché questa soluzione 
si é rivelata troppo limitata in termini di spazio disponibile per le esigenze del 
gruppo, sia per gestire i nostri documenti ‘privatamente’, é stato noleggiato un 
VPS (Virtual Private Server) dedicato al progetto e opportunamente configu- 
rato con NextCloud’, che ha sostituito in breve tempo Dropbox, seppur utiliz- 
zando lo stesso criterio di gestione dei file. 

I responsabili dei vari gruppi linguistici sono stati incaricati di raccogliere 
- all'interno della propria cartella cloud - i file contenenti i vari testi utilizzati 
per costruire il corpus. 

Peri testi da inserire nel corpus viene utilizzato Microsoft Word; questo sof- 
tware & stato scelto in considerazione della necessità dei membri dell'Unità di 
Ricerca di mantenere alcuni degli elementi di formattazione di base come gras- 
setto, corsivo e note a pié di pagina. Word é stato preferito anche ad altre solu- 
zioni (come LibreOffice Writer) a causa dell'esperienza dei membri dei gruppi 


Per quanto riguarda la scelta del software, sono stati preferiti strumenti open source, per vari 
motivi: il codice open source é di qualità superiore e rimane affidabile nel tempo; la traspa- 
renza dell'open source e il controllo fornito da tutti i contributori garantisce una maggio- 
re sicurezza; l'open source ha ampie comunità di utenti che consentono un miglioramento 
continuo delle prestazioni e un'ampia fonte di risposte a tutte le preoccupazioni; le piatta- 
forme open source consentono una maggiore interoperabilità, contro la rigidità di un'unica 
soluzione che non puó soddisfare tutte le esigenze. Tuttavia, tali considerazioni non erano 
necessarie per quanto riguarda Microsoft Word ed Excel, gli altri strumenti usati dai com- 
ponenti dei gruppi linguistici, essendo strumenti di provata efficienza e già a disposizione 
dei ricercatori coinvolti nel progetto. 


23 


RICCARDO BILLERO 


con Word e perché Dropbox (la soluzione cloud utilizzata inizialmente) ha una 

versione online del software. Inoltre, dato che il formato .docx (il formato di fi- 

le utilizzato da Word 2007 in poi) é uno standard XML, ё stato possibile im- 

plementare un software - descritto di seguito — per l'estrazione automatica dei 

testi dai file e il loro inserimento nei corpora. 

Prima di inserire ogni file di testo, i responsabili dei vari gruppi linguistici 
devono salvare i relativi metadati compilando una riga in un file Microsoft Excel", 
contenuto nella cartella cloud della propria lingua; in questo modo ottengono 
il nome che deve essere assegnato al file Word (stabilito algoritmicamente dal 
suddetto file Excel). 

Lutilizzo di un nome di file ottenuto algoritmicamente si é reso necessario 
per facilitare il lavoro dei membri dell'Unità di Ricerca LBC nella fase di con- 
sultazione dei corpora; questo nome deve essere ‘intelligibile’, cioè costituito da 
una serie di elementi che facilitano la ricerca del testo di interesse, distinguen- 
dolo facilmente dagli altri presenti nei corpora. In particolare, alcuni dei meta- 
dati inclusi nel foglio Excel contribuiscono a creare il nome univoco assegnato 
al file contenente il testo; questo nome viene stabilito utilizzando una apposita 
formula Excel e associando delle abbreviazioni per i vari metadati. 

Le informazioni utilizzate per la creazione dei nomi dei file sono: 

a. linguaoriginale del testo; ognilingua é associata al proprio codice, secondo 
la codifica ISO 639-2 Alpha-2, che consente di specificare un paese o una 
regione”. Ad esempio, un libro in inglese britannico sarà identificato dal co- 
dice en-GB. 

b. Categoria e sottocategoria del testo come sopra descritto. Ad esempio, un 
libro classificato come Letterario — Saggistica sarà identificato dall'acroni- 
mo: LET sag. 

c. Autore del testo. La cartella di lavoro di Excel include un foglio di lavoro de- 
gli autori che deve essere compilato dai responsabili dei gruppi linguistici 
con il nome dell'autore e un'abbreviazione univoca di 3-4 lettere che con- 
tribuirà a creare l'identificativo del file di testo utilizzato nei corpora. Ad 
esempio, tutti i libri scritti da Ruskin avrebbero Rusk nel loro identificativo. 
All'interno del foglio di lavoro dei metadati, le celle della colonna Autore mo- 
strano una casellaa discesa riempita automaticamente con i nomi degli autori 
presenti nel suddetto foglio di lavoro degli autori; in questo modo possibile 
ridurre al minimo gli errori di battitura o errate attribuzioni degli acronimi. 

d. Titolo dellibro (o rivista o miscellanea). Come nel caso degli autori, all’in- 
terno della cartella di lavoro di Excel è presente un foglio di lavoro Titoli che 


La scelta di Microsoft Excel per l'archiviazione dei dati è stata fatta per gli stessi motivi per 
cui è stato scelto Word, ovvero la sua pervasività, la sua semplicità d’uso e il fatto che il for- 
mato .xlsx (il formato di file utilizzato da Excel 2007 in poi) è uno standard XML. 

In particolare: per il francese si può scegliere tra la variante della Francia e quella del 
Canada; per l’inglese tra le varianti del Regno Unito e degli USA; per il portoghese 
tra Portogallo e Brasile; per lo spagnolo tra Spagna e America Latina; per il tedesco tra 
Germania, Austria o Svizzera. 
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deve essere compilato dai responsabili dei gruppi linguistici, che inseriscono 
il titolo dellibro e un'abbreviazione univoca di 3-4 lettere che contribuirà a 
creare l'identificativo del file di testo utilizzato nei corpora. Ad esempio, il 
libro Mornings in Florence, sarà associato all'abbreviazione Morn. All'interno 
del foglio dei metadati, le celle della colonna Titolo visualizzano una casella 
a discesa riempita automaticamente con i titoli presenti nel suddetto foglio 
di lavoro Titoli, come nel caso degli autori. 

e. Titolo del frammento (o articolo su rivista o miscellanea). Come nel caso 

degli autori e dei titoli, all'interno della cartella di lavoro di Excel é presente 
un foglio dilavoro Frammenti che deve essere compilato dai responsabili dei 
gruppi linguistici, che inseriscono il nome del frammento e un'abbreviazione 
univoca di 3-4 lettere che contribuirá a creare l’identificativo del file di testo 
utilizzato nei corpora. Se il testo considerato é stato preso nella sua interez- 
Za, deve essere indicato utilizzando l'abbreviazione integ. 
Analogamente ai due casi precedenti, all'interno del foglio dilavoro dei me- 
tadati, la colonna Frammenti mostra una casella a discesa riempita automati- 
camente con i titoli presenti nel suddetto foglio di lavoro Frammenti, come 
nel caso degli autori e dei titoli. 

f. Annodiredazione del testo. Ad esempio, un libro scritto nel 1875 sarà identi- 
ficato dall'acronimo 1875r, dove r significa redazione. Per la data di redazio- 
ne é possibile indicare l'anno preciso (se noto), oppure un'ipotesi dell'anno 
o del secolo di riferimento. 

g. Annodipubblicazione deltesto. Ad esempio, un'edizione del 1881 di un libro 
utilizzato sarà identificata dall'acronimo 1881p, dove p sta per pubblicato. 
Per la data di pubblicazione è possibile specificare l'anno preciso (se noto), 
oppure un'ipotesi dell'anno o del secolo di riferimento. 


Pertanto, il libro Mornings in Florence, scritto in inglese nel 1875 e pubblica- 
to nell'edizione del 1881, classificato come Letterario — Saggistica, sarà identi- 
ficato dal nome di file seguente: 


en-GB LET sag Rusk Morn integ 1875г 1881р 


dove: 

en-GB indica la lingua inglese nella variante del Regno Unito; 
LET sagindicala categoria; 

Rusk é un'abbreviazione per l'autore Ruskin; 

Morn é una abbreviazione del titolo del testo; 

integ indica che il testo é stato considerato nella sua interezza; 
1875r indica che il testo fu redatto nel 1875; 

1881p indica che il testo fu pubblicato nel 1881. 


Per rendere i testi riconoscibili rispetto a quelli in lingua originale vengono 


giustapposti alcuni elementi al nome che il testo ha nella versione in lingua ori- 
ginale. A tal fine i responsabili linguistici devono inserire — nella stessa cartel- 
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la di lavoro Excel fin qui considerata - informazioni sulla versione tradotta del 

testo; in particolare, i dati essenziali per la creazione del nome sono i seguenti: 

a. lingua ditraduzione; come per la lingua originale, è possibile specificare una 
lingua relativa a un paese o una regione; 

b. anno di traduzione (come l'anno di redazione del testo in lingua originale); 

c. anno di pubblicazione (come quello del testo in lingua originale). 


Ad esempio, il caso precedente del testo inglese Mornings in Florence, scrit- 
to nel 1875 e considerato nell'edizione del 1881, classificato come Lettera- 
rio — Saggistica e identificato nell'edizione inglese dal nome del file già visto 
nell'esempio: 


en-GB LET sag Rusk Morn integ 1875г 1881р 
é identificato nella traduzione spagnola dal nome: 
en-GB LET sag Rusk Morn integ 1875г 1881p es-ES 1910t 1910р 


dove la parte giustapposta include: 

es-ES a indicare la lingua spagnola (nella sua variante di Spagna); 

1910t a indicare che il testo fu tradotto (f) nel 1910; 

1910p a indicare che il testo è considerato nella versione pubblicata (p) nel 1910. 


Oltre ai metadati richiesti per creare il nome del file, é anche possibile in- 
serire le seguenti informazioni nel foglio di lavoro di Excel, quali metadati ag- 
giuntivi per il testo: 

e supporto per il quale il testo è stato originariamente creato (carta, CD/ 

DVD, sito web); 

e nome e cognome del curatore (se miscellanea); 

e numero di volume della rivista o mese (se presente); 

e indirizzo web (se presente) da cui proviene il libro o la pagina consultata; 
e casa editrice; 

• luogo di pubblicazione. 


Se il testo é tradotto si possono inserire anche i seguenti metadati: 
e titolo del libro o della rivista o miscellanea tradotta; 
e titolo delframmento (o dell'articolo se è incluso inunarivista o miscellanea); 
e luogo di pubblicazione; 
e nome e cognome del traduttore; 
e indirizzo web (se presente); 
e casa editrice; 
e commenti vari. 


Come risultato di questo flusso di lavoro, all’interno della nostra installazio- 
ne di NextCloud saranno presenti diverse cartelle, una per ogni lingua coinvol- 
ta nel progetto, contenenti tutti i testi da inserire nei corpora; tale operazione è 
gestita dalla seconda parte del flusso di lavoro. 
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5. La creazione dei corpora 


La seconda parte del flusso di lavoro, riguardante tutti i processi digitali ne- 
cessari per raccogliere i testi (con i relativi metadati) e inserirli all'interno di 
corpora strutturati per l'utilizzo da parte del software di gestione dei corpora, 
era invece di nostra responsabilità, come sopra indicato. In particolare, a tal fi- 
ne, sono stati realizzati due appositi software (o, più correttamente, script), uti- 
lizzando i linguaggi di programmazione Bash e Python, automatizzando cosi 
l'intero flusso di lavoro. 

Come accennato in precedenza, dopo una fase iniziale durante la qua- 
le Dropbox é stato utilizzato come soluzione cloud, si é deciso di utilizzare 
NextCloud sul VPS proprietario. Abbiamo noleggiato una macchina virtuale 
fornita da un servizio online, su cui era installata la distribuzione Debian GNU/ 
Linux; tale VPS non solo ha permesso la creazione di un nostro cloud, ma ha 
anche consentito l'esecuzione del suddetto script e la possibilità di rendere di- 
sponibili i vari corpora tramite un servizio web. 

La seconda parte del flusso di lavoro viene coordinata da uno script Bash, 
il quale richiama altri script o software in un ordine ben determinato, ognuno 
responsabile dell'esecuzione di uno dei tre passaggi che trasformano una rac- 
colta di testi in formato Microsoft Word (e i loro metadati in formato Microsoft 
Excel) in un insieme di corpora, ovvero: 

1. riconciliare ogni testo con i suoi metadati e raccoglierlo in un unico docu- 
mento con tutti gli altri testi; 

2. tokenizzare e lemmatizzare tutti i testi; 

3. compilare il corpus. 


Il primo passaggio viene eseguito da un apposito script Python’, il quale leg- 
ge il foglio Excel contenente l’elenco dei testi da inserire nel corpus e dei relativi 
metadati e per ogni riga di informazione in esso presente individua i vari me- 
tadati e il nome assegnato al relativo file Word (generato automaticamente da 
una apposita formula, come sopra indicato); con queste informazioni, lo script 
può quindi cercare nella cartella cloud il file Word e aprirlo. 

A partire dal 2007, ogni documento Microsoft Word viene archiviato uti- 
lizzando il formato Office Open XML (standard internazionale ISO/IEC DIS 
29500). Questo tipo di documento è costituito da un file compresso in cui sono 
presenti vari documenti XML che specificano i molteplici elementi del documen- 


é Bash è una shell e un processore di comandi per i sistemi operativi GNU/Linux che è am- 


piamente utilizzata come shell di login predefinita per la maggior parte delle distribuzioni 
Linux e può leggere ed eseguire comandi da un file, il cosiddetto script di shell. 

Alla base della scelta di utilizzare Python come linguaggio di programmazione ci sono nume- 
rosi motivi: si tratta di un linguaggio completamente gratuito, utilizzabile su varie piattaforme 
(Linux, Windows ecc.), già installato di default in molte distribuzioni Linux (inclusa Debian), 
facile da usare, dotato di librerie per gestire agevolmente documenti in formato Microsoft 
Word ed Excel e più in generale in formato testo e XML, con risultati altamente performanti. 
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to Word, comeil testo in esso contenuto, la sua formattazione, gli oggetti inseriti, 
ecc. Grazie alla conoscenza di questo standard, lo script Python apre ildocumen- 
to Word, ne legge il testo e lo copia come contenuto in un opportuno nodo diun 
documento XML, senza alcun elemento di formattazione; invece gli attributi di 
tale nodo vengono impostati utilizzando tutti i relativi metadati contenuti nel file 
Excel. Come risultato del processo, lo script Python genera in output — per ogni 
lingua - un documento XML contenente tutti i testi con i relativi metadati; quel 
documento verrà quindi utilizzato come input per il passo seguente. 

Tuttavia, poiché la lettura di file Word ed Excel richiede una certa quantità 
di tempo per elaborare il contenuto che diventa eccessivo quando centinaia o 
migliaia di testi vengono inseriti nel corpus, é stata implementata una cache per 
accelerare la ricompilazione del corpus. Tale cache si basa sul principio che una 
volta che i testi e i relativi metadati vengono memorizzati, saranno modificati 
molto raramente e sostanzialmente solo per correggere errori materiali riscon- 
trati successivamente all'inserimento del testo e dei relativi metadati. In questo 
modo diventa piü veloce controllare - ogni volta che il corpus viene ricompilato 
—sesono state apportate modifiche; l'introduzione della cache ci ha permesso di 
ridurreiltempo di ricompilazione diun corpus da poche orea circa dieci minuti, 
perun corpus diun milione di parole. Nonostante aggiunga complessità al flus- 
so di lavoro, l'utilizzo della cache ne riduce i tempi di esecuzione in base al prin- 
cipio che nuovi testi e relativi metadati possono essere continuamente inseriti, 
mentre raramente accade che i testi esistenti vengano modificati (Billero 2020). 

Il secondo passaggio dello script Bash consente la tokenizzazione e quindi 
la lemmatizzazione del testo. La procedura di tokenizzazione trasforma il file 
XML ottenuto come output del passaggio precedente nel cosiddetto file verti- 
cale, ovvero un file strutturato in modo che su ogni riga sia presente un solo to- 
ken (una singola parola o un unico simbolo grammaticale). Questa modalità di 
memorizzazione dei dati é funzionale alla procedura di lemmatizzazione dove 
il cosiddetto Part-Of-Speech (о più brevemente POS) e il lemma vengono me- 
morizzati all'interno del file verticale accanto a ciascun token. 

Ad esempio, la frase «This book is easy to read» verrà memorizzata come 
segue: 


Word POS Lemma 
This DT this 
book NN book 


is VBZ be 
easy JJ easy 
to TO to 
read VB read 
SENT 


Per questa seconda fase, abbiamo scelto di utilizzare TreeTagger, un tagger 
per parti del discorso indipendente dalla lingua (Schmid 1994, 1995), uno dei 
software piü importanti della sua categoria. Pertanto, lo script Bash richiama 
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TreeTagger, utilizzando come input il file XML ottenuto come risultato del pre- 
cedente passaggio contenente tutti i testi con i relativi metadati. 

Infine, il terzo passaggio consiste nella compilazione del corpus, ovvero nel 
memorizzarlo in un formato facilmente accessibile agli utenti finali. Dato il nu- 
mero diversificato di utenti, la consultazione delle informazioni dovrebbe es- 
sere quanto più ampia possibile; pertanto, dovrebbe essere utilizzato un buon 
software di analisi e gestione dei corpora. Esistono due diverse tipologie di tale 
software: quelli che possono essere utilizzati solo su un computer desktop e quel- 
li disponibili come servizio web. Per soddisfare gli scopi del progetto, abbiamo 
scelto un software che potesse essere utilizzato come servizio web. 

Una ricerca dello stato dell'arte ha identificato l'esistenza di tre principali 
software all'interno della famiglia sopra descritta: CWB (IMS Open Corpus 
WorkBench), INL BlackLab e SketchEngine. Va notato che mentre i primi due 
software sono disponibili come open source, SketchEngine é solitamente di- 
sponibile solo a pagamento, ma attualmente é gratuito per i membri degli isti- 
tuti di ricerca in Europa. Tuttavia, é stata rilasciata anche una versione gratuita 
ridotta, chiamata NoSketchEngine, priva delle caratteristiche рїй interessanti 
per lo studio lessicografico incluse nella versione commerciale, come la funzio- 
ne Word Sketch e il thesaurus. 

Tutti etreisoftware sopra menzionati hanno una serie di funzionalità di base 
che sono di fondamentale importanza nella ricerca di corrispondenze, tra cui: la 
possibilità di effettuare ricerche semplici, ricerche utilizzando espressioni regola- 
rio Context Query Language‘, oltre alla possibilità di utilizzare lemmatizzatori 
come TreeTagger, Freeling, RfTagger. Inoltre, tutti e trei software dispongono 
di una speciale API (Application Programming Interface) che consente loro di 
eseguire operazioni come l'interrogazione o l'inserimento di dati tramite sof- 
tware di terze parti appositamente implementati per le proprie esigenze. 

Mentre CWB e SketchEngine dispongono attualmente di un'eccellente do- 
cumentazione e di una solida comunità di riferimento, lo stesso non si puó dire 
per BlackLab, che mostra ancora debolezze in questi aspetti. 

SketchEngine offre anche la funzionalità di Word Sketch, utile per la crea- 
zione di elenchi di parole di termini specifici delle diverse arti e che puó essere 
utilizzata per mettere in relazione parole che si riferiscono allo stesso oggetto 
artistico, per delimitare campi di conoscenza o diriferimento come monumen- 
ti, o distinguere tra oggetti e persone e disambiguare i nomi propri che si riferi- 
scono a queste due categorie. Tuttavia, questa funzione non é disponibile nella 
versione gratuita, ovvero NoSketchEngine. 

Alla fine, abbiamo scelto per la nostra ricerca il software di gestione dei cor- 
pora SketchEngine. Abbiamo anche provveduto ad effettuare un'installazione 
di NoSketchEngine sul nostro VPS rendendo cosi i nostri corpora disponibili 


* Context Query Language (CQL in breve) è un linguaggio di query originariamente creato 


per CWB e successivamente implementato negli altri software menzionati. 
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online? agli utenti finali. Attualmente, i corpora contengono otto milione di pa- 
role, divise per lingua, come indicato nella tabella seguente. 


Tabella 1. Numero attuale di parole per lingua. 


Lingua Parole 

Francese 3.165.000 
Russo 1.900.000 
Inglese 1.036.000 
Spagnolo 1.020.000 
Tedesco 1.018.000 
Italiano 1.009.000 


L'utilizzo del software di gestione dei corpora NoSketchEngine consente 
agli utenti di eseguire vari tipi di ricerche. Un primo tipo di ricerca è la ricerca 
per parola, in cui gli utenti cercano una parola scritta nel modo in cui si aspet- 
tano di trovarla nei corpora; altrimenti è anche possibile cercare il lemma, dove 
NoSketchEngine fornirà i risultati come un elenco di occorrenze di quel lem- 
ma nelle varie forme flesse presenti all'interno del corpus. E anche possibile uti- 
lizzare il linguaggio di query CQL per eseguire ricerche piü selettive, nonché 
la possibilità di specificare un particolare POS (Part-of-Speech) da cercare. Ad 
esempio, l'utente finale puó cercare aggettivi vicino alla parola opera o cercare 
verbi dopo il nome di un pittore, ecc. 

Per quanto riguarda i filtri di ricerca, é possibileutilizzare molti dei metadati 
per limitare l'ambito delle ricerche, dall'intero corpus a una sezione; ad esem- 
pio, gli utenti finali possono filtrare per lingua, autore, titolo dell'opera, catego- 
ria, sottocategoria e cosi via. 

Diconseguenza, possiamo affermare che NoSketchEngine é un potente stru- 
mento per la ricerca all'interno dei nostri corpora utilizzando ricerche generi- 
che o dettagliate e che soddisfa i requisiti del progetto LBC ele diverse esigenze 
degli utenti specificate in precedenza. 


Conclusioni 


La realizzazione di questa prima fase dei nostri corpora é da ritenere soddi- 
sfacente in quanto ha creato le basi necessarie peri primilavori e perle ricerche 
del nostro gruppo (Carpi 2017; Farina, Billero 2018; Billero, Carpi 2018; Lanini, 
Nicolás 2018; Farina, Frinz 2020; Garzaniti 2020), dimostrando il fondamenta- 
le apporto dell'Informatica Umanistica al progetto Lessico dei Beni Culturali. 

Senza dubbio quanto realizzato finora si tratta solo di un primo passo verso 
il raggiungimento di altri prodotti utili alla ricerca nell'ambito della lessicogra- 


? Consultabile su <http://corpora.lessicobeniculturali.net/>. 
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fia dell'arte; ad esempio, in futuro dovrebbe essere introdotta la possibilità di 
etichettare i testi a un livello molto più avanzato rispetto a quanto fatto finora, 
utilizzando standard universalmente riconosciuti. In particolare, poiché i no- 
stri corpora sono strettamente legati ai nomi propri di persona e luogo, é ipotiz- 
zabile che ISNI possa essere utilizzato applicando un'etichetta a ciascuno dei 
nostri nomi per raccogliere i nomi propri di tutte le varianti in tutte le lingue 
presenti nei corpora. 
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Abstract (italiano): In questo contributo si presentano i criteri per la realizzazione, le 
fasi di sviluppo e le possibili applicazioni del Corpus LBC in spagnolo, creato nell'ambito 
del progetto Lessico multilingue dei Beni Culturali (LBC). In primo luogo, si commentano 
brevemente le caratteristiche principali del corpus e i criteri di selezione dei testi che 
contiene. In secondo luogo, vengono illustrati i possibili usi del corpus da parte di diversi tipi 
di utenti, in aree di interesse come il turismo, la traduzione specializzata e l'insegnamento 
dello spagnolo per scopi specifici. 


Parole chiave: linguistica dei corpora, lessico, terminologia, arte, beni culturali. 


Abstract (inglese): This brief essay presents the criteria for the realization, the 
development phases and the possible applications of the LBC Corpus in Spanish, created 
in the framework of the Lexicon of Cultural Heritage (LBC) project. First, the authors briefly 
comment the main features of the corpus and the selection criteria of the texts that are 
included in the corpus. Second, they discuss and illustrate the possible uses of the corpus 
by different types of users and in areas of interest such as tourism, specialized translation 
and the teaching of Spanish for specific purposes. 


Keywords: corpus linguistics, lexicon, terminology, art, cultural heritage. 


Introduzione 


Questo contributo presenta le principali caratteristiche ele possibili applicazio- 
ni del Corpus LBC Espafiol, un corpus monolingue specialistico! che si propone di 
offrireunarappresentazione adeguata del discorso specialistico sull'arte e sul patri- 
monio culturale fiorentino eitaliano in un campione ampio e variegato di testi, con 
la finalità di effettuare ricerche automatizzate e analisi approfondite, quantitative 
e qualitative, in particolare, sullessico artistico. Il corpus é stato ideato e realizzato 


! [corpora specialistici sono rappresentativi di «una variedad lingüística específica o de 


algún tipo de sublenguaje o lengua especializada. [...] Se crean para el estudio de la lengua 
usada para fines específicos y dela terminología usada en sublenguajes» (Pérez Hernández, 
2002). Le loro caratteristiche sono simili a quelle dei corpora di riferimento (quantità, qua- 
lità, semplicità e documentazione), benché normalmente siano rappresentativi dello speci- 
fico dominio di studio per il quale vengono creati. 
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nell'ambito del progetto interuniversitario Lessico multilingue dei Beni Cultural, il 
cui obiettivo principale é la creazione di dizionari monolingui e bilingui correlati 
traloro da collegamenti ipertestuali, basati sull'estrazione di dati contenuti nei cor- 
pora delle diverse lingue descritti in questo volume. Tali strumenti lessicografici 
si propongono di contribuire a migliorare l'attività di autori, redattori e traduttori 
che lavorano con testi di tematica artistica, e di selezionare i termini più appropria- 
ti nei diversi contesti di fruizione ein tipologie discorsive come, ad esempio, guide 
turistiche, pagine web di musei o cataloghi di mostre. Allo stesso modo, il proget- 
to si propone di realizzare studi comparativi che permettano di specificare l'am- 
bito semantico e di trovare le possibili equivalenze dei termini relativi all’arte e al 
patrimonio culturale toscano e italiano in diverse lingue (cinese, francese, inglese, 
portoghese, russo, spagnolo, tedesco). Da un lato, il progetto lavora sul lessico rela- 
tivo ai beni culturali della città di Firenze e ai nomi propri relativi alla sua storia e 
al suo patrimonio artistico e architettonico; dall'altro, affronta i termini legati alla 
pittura, all'architettura, alla scultura e alle altre arti che caratterizzano il patrimo- 
nio artistico e culturale in un senso рїй applicato e focalizzato sulle tecniche, i ma- 
teriali e gli strumenti utilizzati nella creazione, conservazione e diffusione di tale 
patrimonio. Al fine di raggiungere i suddetti obiettivi sono stati selezionati una se- 
rie di testi rappresentativi del patrimonio artistico fiorentino per la loro integrità, 
rilevanza nella materia e capacità di leggere termini ed espressioni antiche in chia- 
ve moderna. Le parole e le collocazioni tratte da questi testi saranno incorporate 
nella struttura del dizionario LBC, con particolare attenzione alloro rapporto con 
le connotazioni che hanno acquisito nel tempo. 


1. Corpus LBC Spagnolo 


Prima di costituire un corpus di testi rappresentativi del lessico dell'arte e 
del patrimonio fiorentino e italiano in spagnolo, é stato necessario considerare 
alcune questioni relative alla finalità del corpus, alla sua dimensione, rappresen- 
tatività, autenticità ed equilibrio. In primo luogo, si é riflettuto sulla distinzione 
stabilita nella linguistica dei corpora tra l'approccio corpus-based e corpus-driven 
(Tognini-Bonelli 2001), un aspetto connesso agli obiettivi che avrebbero guidato 
la progettazione del corpus е l’estrazione dei dati perla preparazione del lemma- 
rio. Il primo tipo di corpus funge da metodo di indagine e aiuta a validare ipotesi 
preesistenti, mentre nel secondo, adottato in questo caso, l'insieme dei testi rac- 
colti fa parte della ricerca e può dare origine a nuove conoscenze e teorie. D'altra 
parte, trattandosi di un corpus specialistico, si è ipotizzato che la sua dimensio- 
ne sarebbe stata inferiore a quella di un corpus generale o di riferimento, senza 
rinunciare comunque ad ottenere un numero di parole di lessico artistico supe- 
riore al milione; nello specifico, attualmente il corpus (20.08.2019) è formato da 
1.020.872 parole (1.162.849 token) e da un totale di 207 documenti (Figura 1). 


> Informazioni sul progetto: «http://www.lessicobeniculturali.net/contenuti/il-progetto/ 


818». 
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Corpus LBC Spagnolo © 


Corpus LBC Spagnolo 


Counts General info Lexicon sizes 
Tokens 1,162,849 Corpus description Document word 59,196 
Words 1,020,872 Language Spanish tag 70 
Paragraphs 14,776 Encoding UTF-8 lemma 38,986 
Documents 207 Compiled 08/27/2018 17:11:02 сө 53,835 
Tagset Description lemma_lc@ 36,350 


Figura 1. Dati quantitativi del Corpus LBC espanol. 


Consideriamo il Corpus LBC Español rappresentativo del lessico dell'arte? е 
del patrimonio artistico fiorentino in spagnolo grazie all'equilibrio che lo carat- 
terizza tra la quantitä di testi relativi al patrimonio artistico, storico, politico e 
culturale della città di Firenze, e di quelli che si occupano di oggetti, materiali e 
tecniche principalmente legati alla pittura, architettura e scultura. Il criterio di 
rappresentativitä e soddisfatto anche grazie alla selezione di unitä testuali che 
riguardano periodi storici diversi, cosi come di autori, temi, registri e culture 
differenti. Infine, va sottolineato che si tratta di un corpus semiaperto, poiché 
prevede l’inserimento futuro di nuovi testi (Rojo 2015: 373). 


1.1. Selezione testuale 


Il lessico dell’arte sorge nel Medioevo nell’ambito delle ars, attività artigia- 
nali con una propria terminologia tecnica (vid. Biffi 2010). Successivamente, a 
partire dal XVIII secolo, per riferirsi alla pittura, all'architettura e alla scultu- 
ra nasce un nuovo concetto, quello di «belle arti», che allude nello stesso tem- 
po alla tecnica e alle diverse tipologie di attività con valore estetico (Carchia, 
D'Angelo 2007: 17). La genesi el'evoluzione del linguaggio a fini artistici spiega 
perché le parole legate all'arte e alla critica d'arte siano lontane dal costituire un 
insieme di termini ed espressioni univoche (De Mauro 1965: 37). In effetti, il 
lessico dell'arte si colloca a metà tra i linguaggi specialistici e il linguaggio co- 


? Questo corpus costituisce una risorsa senza precedenti nel panorama spagnolo, lingua nella 


quale sono presenti numerosi corpora di riferimento per lo studio della lingua sia in sincro- 
nia sia in diacronia, come il CORPES XXI (Corpus del Español del Siglo XXI), il CORDE 
(Corpus Diacrónico del Español) o il CREA (Corpus de Referencia del Español Actual, che 
integra altri corpus orali), della Real Academia de la Lengua <https://www.rae.es/recursos/ 
banco-de-datos>; citiamo inoltre, per lo studio delle varietà di spagnolo, il corpus PRESEEA 
(Proyecto para el estudio sociolingüístico del español de España y América, <http://pre- 
seea.linguas.net/>). Per quanto riguarda i corpora di specialità, si segnala lo IULA Corpus 
(Institut de Lingüística Aplicada) dell'Università Pompeu Fabra, che contiene testi scritti in 
diverse lingue, riguardanti economia, diritto, ambiente, medicina, informatica e scienze del 
linguaggio «https://www.upf.edu/web/iula/corpus», el Archivo Gramatical de la Lengua 
Española (AGLE,<https://cvc.cervantes.es/lengua/agle/>) eil Léxico de la Alimentación y 
el Arte culinario tradicionales (<https://people.unil.ch/rolfeberenz/corpus/>). 
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mune, e presenta un alto grado di variazione a seconda del tipo di testo in cui si 
trova*. Infatti, come segnala Carpi (2015: 112): 


El lenguaje para fines artisticos (LFA) integra varios subconjuntos de 
lenguajes de especialidad - los de la musica, las artes visuales, la arquitectura, 
el cine, el teatro, la fotografía, etc. – cada uno dotado de un discurso propio y 
caracterizado por rasgos léxicos, estilisticos y retöricos. 


Anche per questo, <[...] el carácter polisémico de las unidades léxicas» (Ca- 
bré 2006: 29) si manifesta con frequenza in questa lingua specialistica, benché, 
in un dato contesto, esse costituiscano unitä di discorso specializzato. 

Sulla base di quanto detto, e tenendo conto della natura eterogenea del lessi- 
co artistico e della varietá di tipologie discorsive in cui si manifesta, prima della 
selezione dei testi che avrebbero costituito il Corpus LBC Español il gruppo di 
ricerca dilingua spagnola del Progetto LBC, coordinandosi con quelli delle al- 
tre lingue, ha stabilito due grandi blocchi tematici. In un primo momento sono 
stati raccolti testi relativi alla città di Firenze, considerata la città d'arte per ec- 
cellenza, opere originali scritte in spagnolo o tradotte dall'italiano, dal francese 
e dall'inglese, pubblicate trail XVI eil XX secolo. Questi testi sono stati selezio- 
nati per la loro rilevanza culturale e interculturale: si tratta infatti di opere let- 
terario-biografiche e di viaggio, che consentono di comprendere i diversi punti 
di vista legati all’arte italiana e di ampliare così la scelta terminologica (Billero, 
Nicolás Martínez 2017). Questa prima serie di testi comprende principalmen- 
te scritti su Firenze ela Toscana, anche se, nelle fasi successive del lavoro, si so- 
no aggiunte opere relative all'Italia nel suo complesso. L'obiettivo di ottenere 
la maggior varietà testuale possibile giustifica la decisione di includere opere di 
autori molto diversi tra di loro: il corpus comprende scrittori spagnoli molto co- 
nosciuti come Pedro Antonio de Alarcón (De Madrid a Nápoles, 1861), Leandro 
Fernández de Moratín (Viaje a Italia, 1867) o Vicente Blasco Ibáñez (En el país 
del arte, 1896) e altri meno noti, quali Gregorio Iribas y Sánchez (Viaje por Ita- 
lia y Suiza, 1897) e José de Lasa (De Madrid al Vesubio. Viaje por Italia, 1873), 
che offrono uno sguardo concreto sull'arte italiana e utilizzano una termino- 
logia propria. Questo primo gruppo include anche le opere tradotte di scrittori 
come François-René de Chateaubriand (Viaje a Italia, 1831, trad. Mariano de 
Rementería) e John Ruskin (Las mafianas de Florencia, 1901, trad. Carmen de 
Burgos), che propongono una ricca e dettagliata descrizione del patrimonio ar- 
tistico fiorentino e italiano, e utilizzano un lessico che combina in modo equi- 
librato divulgazione e specializzazione. 


Nonostante la ricchezza di questa lingua specialistica e delle tipologie testuali in cui si ma- 
nifesta, le analisi sistematiche sulla lingua a fini artistici in spagnolo scarseggiano (Carpi 
2017). Tuttavia, vale la pena citare alcuni studi relativi alla comunicazione della critica d’ar- 
te (García Rodríguez 1999) o ai termini del disegno e della pittura (Montijano García 2010; 
Carpi 2015). All'interno di questa tipologia di ricerca é inoltre possibile inserire studi sul 
discorso del turismo in spagnolo (Calvi e Mapelli 2011), in cui il lessico dell’arte è solita- 
mente molto presente. 
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In un secondo momento, sono stati raccolti testi tecnici riguardanti l’archi- 
tettura e l’arte (principalmente pittura e scultura), privilegiando trattati critici e 
manuali in quanto fonte essenziale di terminologia specialistica. Come nel caso 
precedente, sono state incluse sia opere originali spagnole, come il Tratado de 
arquitectura di Alonso de Vandelvira (1977 [1591]), che contiene sia termini ar- 
chitettonici sia quelli che caratterizzano l’arte del taglio delle pietre da costru- 
zione, e i Didlogos de la pintura di Vicente Carducho (1633), siale opere tradotte 
di Leon Battista Alberti (Los diez libros de arquitectura, 1797 [1485]), Andrea 
Palladio (Los quatro libros de arquitectura, 1797 [1570], tradotti da J. Francisco 
Ortiz y Sanz) e Leonardo da Vinci (El Tratado de la Pintura, 1784 [1651], tra- 
dotto da D. Antonio Rejön de Silva). Il corpus comprende anche la traduzione 
di classici riguardanti il periodo rinascimentale a Firenze, come Las Obras hi- 
stéricas de Nicolás de Maquiavelo (1892, tradotto da Luis Navarro), e altri sag- 
gi in spagnolo dedicati ad artisti italiani, per esempio Las vidas de los pintores y 
estatuarios eminentes espafioles (1744) di Palomino de Castro e El artista en Ita- 
lia di José Galofre (1851), che comprendono numerosi antroponimi e toponimi 
culturalmente rilevanti perla storia dell’arte italiana. 

Una menzione speciale merita l’opera Le vite de’ più eccellenti pittori, sculto- 
ri, e architettori di Giorgio Vasari, le cui edizioni, Torrentina (1550) e Giuntina 
(1568), occupano un posto centrale riguardo l’arte rinascimentale italiana e la 
sua storia. Il testo del Vasari è una fonte essenziale del corpus poiché: 


le due anime delle lingue delle arti, umanistica e tecnica, convivono in 
Vasari, che di fronte all'opera narra la percezione visiva dell’osservatore, ma si 
appoggia anche alla sua competenza pratica, come emerge a livello sia lessicale 
sia sintattico (Biffi, 2010). 


Vasari introduce nella sua opera termini che collegano il lessico tecnico e al- 
cuni concetti che anticipano il linguaggio della critica sopra menzionato, come, 
rispettivamente, disegno, e più precisamente, le «tecniche di disegno» e maniera, 
spesso tradotto come «stile» di un artista o di un’epoca (Pano Alamän 2017). 
Nello specifico, il Corpus LBC espanol raccoglie le traduzioni con la maggiore 
diffusione editoriale, alla base di antologie o selezioni di testi: quelle del 1960, 
eseguite da Julio E. Payrató sulla base dell'edizione del 1568; la versione del 2011, 
di Marfa Teresa Méndez Baiges e Juan Maria Montijano Garcia, e la versione del 
2012 di Helena Aguilà, quest’ultima basata sulla prima edizione delle Vite del 
1550. Per il momento, questi testi sono anche la base del corpus parallelo che 
stiamo preparando e annotando nell’ambito del progetto LBC. 


1.2. Fasi di raccolta e archiviazione dei testi 


La gestione dei contenuti del corpus è stata guidata da criteri di raziona- 
lità ed efficienza (Billero, Carpi 2018), con l’archiviazione sulla piattaforma 
NextCloud dei testi raccolti dopo una ricerca in cataloghi e banche dati online 
(Billero 2020). La cartella conteneva un foglio di calcolo Excel che ha permes- 
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so di generare 1 nomi dei file di testo presenti nel corpus, facilitando il lavoro in 
fase di consultazione delle concordanze; il nome del file é costituito da una serie 
univoca di descrittori e metadati relativi ai testi, quali lingua, autore, titolo, an- 
no di pubblicazione, ecc. (vid. Billero, Nicolás Martínez 2017), che consentono 
anche di interrogare il corpus in modo intuitivo. I testi sono stati memorizzati 
in Word, programma scelto per il suo uso diffuso, per l'interoperabilità che pre- 
senta all'interno del progetto LBC e perla necessità di mantenere gli elementi di 
base del formato, come grassetto, corsivo, note a pié di pagina, ecc. D'altra parte, 
il formato .docx é uno standard XML, elemento che ha permesso di creare un 
software speciale in grado di rielaborare automaticamente tuttii file e generarne 
di nuovi con lo stesso formato, nome e metadati. Per poter effettuare ricerche, i 
testi sono stati caricati automaticamente in SketchEngine. 


2. Uso del Corpus LBC español 


Questa sezione presenta sinteticamente esempi di consultazione del corpus, 
al fine di mostrare il suo interesse per guide, traduttori, accademici e insegnanti 
di spagnolo per scopi specifici (espafiol para fines específicos, EFE). Le interro- 
gazioni effettuate con il programma SketchEngine possono essere molto utili: in 
particolare, quella effettuata utilizzando la funzione context permette di cercare 
una determinata parola e le sue corrispondenze con altre parole appartenenti a va- 
rie categorie grammaticali, e rende disponibili lessici combinati validati dall'uso. 

Come sottolinea Cabré, la terminologia rappresenta una «actividad de re- 
copilación e ilustración de las fórmulas detectadas en el discurso especializa- 
do» (2004: 98); la consultazione di corpora specializzati, quindi, consente di 
identificare tali formule e di ottenere elenchi di unità di conoscenza con diversi 
gradi di lessicalizzazione. Nell'ambito della redazione di testi peril turismo, co- 
me per esempio una guida al patrimonio artistico-culturale di Firenze, é impor- 
tante considerare sia le frequenti collocazioni in cui un sostantivo é associato a 
un toponimo o antroponimo, sia quei termini scritti in volgare toscano o nell'i- 
taliano attuale -varietà diacroniche e diatopiche- relative a personaggi e luoghi 
della Firenze della metà del Cinquecento. Di fronte alla possibilità di adattare 
o tradurre alcuni riferimenti geografici o di lasciare gran parte dei nomi in ita- 
liano senza essere in grado di valutare se tali riferimenti siano noti nella cultura 
di arrivo, i professionisti del settore turistico possono trovare nel corpus LBC 
un valido strumento per stabilire qual ё la forma più comune e approfondire la 
conoscenza enciclopedica del termine. Ad esempio, l'antroponimo «Médicis» 
presenta 508 occorrenze nel corpus rispetto a 7 perla forma italiana «Medici» 
e 14 per la forma ibrida «Medicis». Sebbene queste due forme siano validate dal 
loro uso nei testi, la maggiore frequenza della prima, adattata allo spagnolo, in- 
dica che éla più appropriata. L'utilizzo della funzione Word Sketch di SketchEn- 
gine, invece, consente di estendere l'indagine iniziale: oltre alle occorrenze del 
cognome generalmente associate ai nomi dei familiari, é possibile recuperare 
collocazioni relative ad opere d'arte, come «Venus de Médicis»: 
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doc#33 obra capital del Palacio Pitti, como la Venus de Medicis lo es de la Galeria degli Uffizi. </p><p> El maravilloso 
doc#33 reemplazó en la Tribuna de Uffizi á la Venus de Médicis , cuando los franceses se apoderaron de esta y se 
doc#33 puede compararse а la de Cleomenes. La Venus de Médicis ha vuelto а Italia, у nos espera en la tribuna de 
doc#33 de aquella galeria, fruto del amor de los Medicis ä las bellas artes: amor que heredaron, como una 
eregrinos ä esta ciudad, es la Ven e escu la en enas, cerca de dos siglos antes 
doc#33 artísticos de la antigüedad. </p><p> La Venus de Médicis ,—llamada asi porque la adquirió Florencia en 
doc#33 desapasionadamente que son inferiores ä la de Médicis : no asi los franceses, que tratan de hacer creer 
doc#33 . </p><p> Conviniendo, pues, en que la Venus de Médicis es la mas bella obra del arte, comprended la 
doc#33 . «/p»«p» De dos maneras hay que considerar а la Venus de Médicis : como mujer y como escultura, 6 sea como modelo y 
doc#33 de nuestros ojos. </p><p> Ahora bien, la Venus de Médicis es el modelo abstracto de la hermosura femenina 
doc#33 fijarla al crear а nuestra madre Eva. </p><p> La Venus de Médicis causa el mismo efecto que el cielo, que la música 
doc#33 . Considerada como estätua, la Venus de Médicis es todo lo que hemos dicho; ¡todo eso... fingido 
doc#33 , por el contraste que hacia con la Venus de Médicis ‚ fue una Venus de Ticiano, toda desnuda, 


Figura 2. Concordanze di «Venus de Médicis». 


Figura 3. «Venus de Médicis» in contesto, in Alarcón, P. A. de (1861), De Madrid a 
Nápoles. Riferimento dell'archivionelcorpus: Alarc_MadNap_Tosc95_1861r_1861p. 


Allo stesso modo, la ricerca sul toponimo «Firenze» permette di estrarre no- 
mi di edifici religiosi (Santa Croce, Santo Espirito, Santa María del Fiore), luoghi 
(plaza San Giovanni) e talvolta di artisti poco conosciuti (Rocco Zoppo o Tad- 
deo Gaddi), che possono fornire indizi sulla formula linguistica più rilevante e 
arricchire il contenuto di un testo di viaggio sul patrimonio della città (vid. Pa- 
no Alamán 2019). In questo senso, consultare il corpus puó risultare utile anche 
nell'insegnamento dello spagnolo per scopi specifici (EFE) nei settori delle belle 
arti o del turismo, grazie alle informazioni culturali che contiene e alle possibi- 
lità di indagare i possibili significati di parole tecniche. Ad esempio, l'esplora- 
zione del contesto in cui compare il termine piagnone, con due occorrenze nel 
corpus, ci permette di comprendere, grazie alla spiegazione fornita dal Vasari, 
che si tratta dei seguaci di fra’ Girolamo Savonarola (Figura 4): 


Figura 4. Frammento delle Vidas di Vasari (vita di Botticelli), dove appare piagnone. 


D'altra parte, la ricerca di frequenze e concordanze della parola «diseño» 
può contribuire ad ampliare il lessico dello studente di spagnolo per fini artisti- 
ci, poiché la sua analisi nel contesto ci consente di cogliere non solo il significato 
più esteso del termine, come «1. m. Traza o delineación de un edificio o de una 
figura; 2. m. Proyecto, plan que configura algo», ma anche il piü ristretto, ovve- 
ro «3. m. Concepción original de un objeto u obra destinados a la producción en 
serie» (DLE, 23? ed., 2014, corsivo nostro), che generalmente viene associato 
al termine «dibujo». La consultazione comparativa di questi due termini illu- 
stra i significati di entrambi, sui quali si puó riflettere in aula dal punto di vista 
linguistico, ad esempio in relazione a collocazioni più o meno ricorrenti («eje- 
cutado con gracia y diseño», «diseño de la cúpula», «diseños de arquitectura», 
«dibujo anatómico», «dibujo del natural», «dibujo a pluma»). Inoltre, l'ana- 
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lisi delle concordanze dei testi del corpus riguardanti pittura e architettura può 
anche contribuire a una riflessione di carattere culturale. 

Gli esempi citati si dimostrano utili anche nel campo della traduzione spe- 
cializzata, poiché il trasferimento del contenuto di un testo specializzato da una 
lingua-cultura a un'altra «implica [...] el conocimiento de las formas terminológi- 
cas específicas en la lengua de partida» (Cabré 1993: 107); quando si parla di 
traduzione specializzata è infatti necessario non sottovalutare parametri come il 
genere, il registro e il meta-discorso del testo di partenza (Suau-Jiménez 2010). 
Come si ricordava, i testi possono essere utilizzati per identificare le opzioni di 
traduzione più appropriate in base sia alla loro frequenza di изо, alle collocazioni 
e alla rilevanza in determinati contesti linguistici, sia al testo di destinazione e 
al destinatario, come nel caso di termini che caratterizzano la tecnica pittorica 
come «pittura a tempera» (Carpi 2015). Allo stesso modo, il confronto delle 
traduzioni delle Vite contenute nel corpus permette di individuare le soluzioni 
adottate dai traduttori, in particolare per quanto riguardai realia ei nomi propri 
diluoghi e persone, e di valutare, ad esempio, se sia possibile tradurre, adattare o 
mantenere le forme cosi come sono. Tornando al caso di piagnone, termine lega- 
to alla situazione politica e religiosa della Firenze rinascimentale*, le traduzioni 
mantengono la forma italiana del termine, conservando la forma originaria e il 
riferimento culturale e storico, che puó essere compreso dal contesto. Questo 
tipo diricerca permetterà al traduttore di accedere a tutte le possibili opzioni in 
fase di documentazione e di traduzione, risolvendo alcune delle carenze dei di- 
zionari bilingui tradizionali. La prospettiva diacronica e i criteri interculturali 
che stanno alla base del corpus guidano il traduttore nel prendere decisioni ter- 
minologiche corrette. Grazie ai varitipi ditesto (generi, temi, carattere divulgati- 
vo o specialistico, originali, traduzioni) che compongono il corpus e perl'ampio 
arco temporale che coprono, ci si aspetta che questa risorsa faciliti l'accesso a 
termini e informazioni culturali che altrimenti non sarebbero facili da trovare. 


3. Sviluppi futuri 


Da quanto sié detto, risulta evidente il carattere originale del corpus che pre- 
sentiamo e la sua grande importanza pratica e teorica per la ricerca sulle lingue 
specialistiche e sulla traduzione. D’altra parte, il Corpus LBC Espanol si propo- 
ne come un progetto a lungo termine, la cui utilità risiederà nell'essere aperto e 
dinamico. Per questa caratteristica, consideriamo la sua pubblicazione il primo 
segmento di un’opera più ampia, il cui perseguimento includerà l'ampliamento 
del corpus al fine di massimizzare la coerenza con le altre lingue del progetto, 
nonché la presenza di alcuni generi sottorappresentati. Il corpus sarà ampliato 


«3. Come termine storico, nome dato a Firenze, negli ultimi anni del sec. 15, ai seguaci di 
frate С. Savonarola, per il loro continuo sollecitare riforme politiche con l'argomento della 
collera divina, e per il loro voler imporre un tono di penitenza e di contrizione alla vita quo- 
tidiana». Disponibile su: <http://www.treccani.it/vocabolario/piagnone/>. 
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con traduzioni spagnole esistenti di opere francesi, tedesche e inglesi presenti 
negli altri corpora, e con dizionari e manuali di storia dell'arte, tipologie meno 
presenti in questa fase. Questo incremento consentirà di stabilire una serie di 
corpora paralleli, la cui importanza per gli studi di traduzione è ben nota, e che 
rappresenta uno degli obiettivi per i prossimi anni. 


Bibliografia 


Biffi M. 2010, Arte e critica d'arte, lingua dell’, Enciclopedia dell italiano, <https://bit. 
ly/31XQ yBw> (08/2019). 

Billero R., Nicolás Martínez M.C. 2017, Nuove risorse per la ricerca del lessico del 
patrimonio culturale: corpora multilingue LBC, «CHIMERA Romance Corpora and 
Linguistic Studies», 4(2): 203-216. 

Billero R., Carpi E. 2018, Corpora eterminologia artistica: il caso del corpus spagnolo LBC, 
«CHIMERA Romance Corpora and Linguistic Studies», 5(1): 85-91. 

Billero R. 2020, Cultural Heritage Lexicon: A Case Study, in Pano Alamán A., Zotti V. 
(eds.), The language of art and cultural heritage: a plurilingual and digital perspective, 
Cambridge Scholars Publishing, Newcastle upon Tyne: 86-103. 

Cabré M.T. 2006, Lenguajes de especialidad y enseñanza de lenguas, in Cabré M.T., Gómez 
de Enterría J. (eds.), La ensefianza de los lenguajes de especialidad. La simulación 
global, Gredos, Madrid: 9-73. 

Calvi MV., Mapelli G. (eds.) 2011, La lengua del turismo. Géneros discursivos y terminología, 
Peter Lang, Bern. 

Carchia G., D'Angelo P. 2007, Dizionario di estetica, Laterza, Roma. 

Carpi E. 2015, Elespanol de la pintura y los recursos lexicográficos y terminolögicos: cómo 
traducir al espafiol tempera y guazzo, «Cuadernos AISPI», 6: 111-126. 

— 2017, El lenguaje para fines artísticos: traducciones de tondo al espafiol, in Curado A. 
(ed.), EPiC Series in Language and Linguistics, 3, LSP in Multi-disciplinary Contexts 
of Teaching and Research. Papers from the 16th International AELFE Conference: 79- 
84, «https://doi.org/10.29007/wx3m». 

De Mauro T. 1965, Il linguaggio della critica d'arte, Vallecchi, Firenze. 

Montijano García, J.M. 2010, El disegno en los siglos XVI y XVII, «I+Diseño: revista 
internacional de investigación, innovación y desarrollo en diseño», 2(2): 39-46. 

Pano Alamán A. 2017, El léxico del arte y su traducción: un estudio a partir de las ‘vidas’ de 
Vasari, in González Pastor D. M. (ed.), La traducción de los textos de especialidad: una 
perspectiva multidisciplinar, Publicacions Universitat de Valéncia, Valéncia: 195-221. 

— 2019, El léxico del patrimonio cultural florentino en blogs y reportajes de viaje en línea, 
«CLAC. Círculo de Lingüística Aplicada a la Comunicación», 78: 49-62. 

Pérez Hernández M.C. 2002, Explotación de los córpora textuales informatizados para 
la creación de bases de datos terminológicas basadas en el conocimiento, «EliEs», 18, 
<http://elies.rediris.es/elies18/>. 

Rojo G. 2015, Hispanic corpus linguistics, in Lacorte M. (ed.), The Routledge Handbook 
of Hispanic Applied Linguistics, Routledge, London: 371-387. 

Suau-Jimenez F. 2010, La traducciön especializada, Arco Libros, Madrid. 

Tognini-Bonelli E. 2001, Corpus linguistics at work, John Benjamins, Amsterdam. 


41 


Un itinerario letterario nel corpus LBC in lingua 
inglese 
Ilaria Natali 


Abstract (italiano): Questo contributo si propone di illustrare il corpus inglese creato per 
LBC in un momento importante della sua evoluzione, il raggiungimento di un milione di 
parole (2018). Ci si sofferma, poi, sul sub-corpus letterario, al momento il più sviluppato; 
nonostante le opere ivi incluse siano apparentemente diverse tra loro, stabiliscono 
una complessa rete di connessioni intertestuali che si snoda a рїй livelli е si estende 
principalmente attorno alle Vite di Vasari. 


Parole chiave: poesia dell'Ottocento, età Vittoriana, corpus letterario, viaggio e turismo. 


Abstract (inglese): This brief essay discusses the English corpus for the LBC project at 
an important stage of its development, after it reached one million words (2018). Focus 
is especially on the literary sub-corpus in English, which is currently the richest: despite 
the apparent diversity of the works it comprises, most of its texts are connected to one 
another at various levels, interlinking into a web-like form that extends outward primarily 
from Vasari's Lives. 


Keywords: Nineteenth-century poetry, Victorian age, literary corpus, travel and tourism. 


1. Premessa: il corpus LBC in lingua inglese 


Avvalersi del supporto di corpora è irrinunciabile nella compilazione dei nuo- 
vi dizionari in formato elettronico, che risultano cosi «far more exhaustive, au- 
thentic, and reliable than printed dictionaries compiled manually with lexical 
databases obtained from secondary sources» (Dash 2008: 85). Sebbenei primi 
corpus-based dictionaries abbiano fatto la propria comparsa soltanto negli anni 
Ottanta del ventesimo secolo, la tradizione lessicografica anglofona ha fatto ri- 
corso a citazioni testuali da inserire in fraseologie esemplificative sin dal Sette- 
cento: fu Samuel Johnson, autore del notissimo dizionario della lingua inglese 
del 1755, il primo ad esaminare dati empirici, raccogliendo termini ed espres- 
sioni in uso tra il 1560 e il 1660 (Crystal 2007: 214). Oggi, corpora linguistici 
di notevoli dimensioni quali il British National Corpus, The Bank of English e il 
Cambridge International Corpus attraggono crescente attenzione per le loro po- 
tenzialità sia in ambito teorico, sia negli usi pratici. 

Il progetto LBC, che annovera tra i propri obiettivi prioritari la creazione di 
un dizionario specialistico multilingue dedicato ai beni culturali dell'area fio- 
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rentina, poggia le proprie fondamenta proprio sulla linguistica dei corpora, che 
apre al lessicografo o lessicologo nuove prospettive sulla lingua, oltre a permet- 
tere osservazioni piú precise su collocazioni, semantica dei lemmi ed espressioni 
polirematiche. Centrale per il progetto é procedere a raccolte di testi trascritti in 
formato elettronico che offrano uno sguardo quanto рїй ampio possibile sul modo 
in cui i beni culturali fiorentini sono stati «tradotti» in parole (nonché in varie 
lingue) attraverso i secoli. Il corpus in lingua inglese ё stato sviluppato principal- 
mente nel corso del 2018, con l'aggiunta di numerosi nuovi testi e una revisione 
generale di quelli inseriti precedentemente, operazioni che hanno permesso di 
raggiungere la soglia indicativa minima per l'estensione dei corpora LBC, stabi- 
litain un milione di parole. Si tratta di un punto di svolta che é opportuno consi- 
derare alla stregua di un primo passo in un processo ancora lungo, che richiederà 
varie fasi di revisione e soprattutto di ampliamento, vista anche l'abbondanza di 
risorse disponibili in lingua inglese in formato elettronico e cartaceo. 

Attualmente composto di testi prodotti a partire dal sedicesimo secolo sino 
ad oggi, il corpus in lingua inglese é chiaramente un sample corpus, ancora di 
estensione molto limitata, che sarà presto ampliato e aggiornato introducendo 
nuovi testi selezionati tenendo conto non solo dell'importanza dei contenuti, 
ma anche di rappresentatività e bilanciamento. E vero che, come nota France- 
sca Bianchi, i corpora specialistici possono essere di dimensioni рїй contenute 
rispetto a quelli generalisti (2012: 34); tuttavia, trovo sempre validala popolare 
affermazione spesso attribuita a Bob Mercer e Fred Jelinek, «more data is better 
data» (cfr. Hans 1992: 110). La rappresentatività & meglio garantita da corpo- 
ra ampi e multidimensionali, dove é anche possibile incontrare «a reasonable 
number of hits for infrequent or rare linguistic events» (Bianchi 2012: 33); in 
altre parole, più informazioni contiene il corpus, più sono precise e dettagliate 
le osservazioni che se ne possono ricavare. 

Se per alcuni studiosi l'estensione dei corpora a vari milioni di parole puó 
compensare una scarsa differenziazione delle varietà di testo rappresentate, per 
altri l'ampia differenziazione delle varietà é condizione essenziale per poter ge- 
neralizzare i risultati. La varietà é componente chiave per i corpora LBC, tutti 
articolati in una medesima struttura di sotto-corpora che, nel caso della lingua 
inglese, ci si propone di sviluppare in modo quantitativamente bilanciato. I sotto- 
corpora fanno riferimento a macro-varietà testuali quali, ad esempio, la distin- 
zione primaria tra fiction e non-fiction; si tratta di una strutturazione non priva 
di difficoltà, poiché i confini tra categorie diverse si possono fare instabili, come 
nel caso di Mornings in Florence (1875) di John Ruskin, un'anticonvenzionale 
guida per viaggiatori sulla quale torneremo a breve. Queste difficoltà, a mio pa- 
rere, possono rivelarsi un vantaggio per il corpus, poiché permettono alle varietà 
di testi di collocarsi in un continuum, sovrapponendosi e integrandosi tra loro. 

Il presente contributo non intende soffermarsi sulle fasi tecniche di costru- 
zione del corpus, dal momento che riflessioni, criteri e propositi relativi alla sua 
progettazione sono stati condivisi all'interno del gruppo di lavoro LBC e sono 
appannaggio soprattutto dei coordinatori generali del progetto. Vorrei dirigere 
l'attenzione, invece, sul mio ambito specifico di competenza, la letteratura, per 
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evidenziare come il sotto-corpus letterario LBC che sta gradualmente prenden- 
do forma possa costituire un terreno fertile per la ricerca. D’altra parte, & solo 
negli ultimi decenni che l'analisi letteraria ha riconosciuto l'utilità dei corpora 
quali strumenti atti a rendere «concreti» agli occhi di lettori e studiosi elemen- 
ti quali «linguistic evidence, style ornamentations, aesthetic choices, manners 
of expressions or deviations from language norms» (Sciarrino 2019: 144). Pat- 
tern di uso che solitamente sfuggono ad una lettura «tradizionale» del testo 
possono essere colti attraverso l'analisi computerizzata, seguendo metodi che 
presentano il vantaggio (non secondario) di avvicinare studi letterari e lingui- 
stici. La ricerca lessicografica su corpus testuale permette di evidenziare corre- 
lazioni semantiche, disseminazione, costellazioni lessicali che svelano le linee 
di tensione annidate nelle pieghe del linguaggio. 

Almomento, il sotto-corpus letterario LBC include principalmente testi an- 
glofoni ottocenteschi. Il motivo di questo sbilanciamento temporaneo su un pe- 
riodo specifico é legato alla reperibilità dei testi stessi e ha innanzi tutto radici 
storico-culturali: a partire dal 1815, per una combinazione di fattori economi- 
ci, sociali e politici, fioriscono le opere in lingua inglese che affrontano il tema 
del viaggio o ne narrano le esperienze. In Italia, sostanziali miglioramenti nei 
sistemi di trasporto favoriscono l'attrattiva turistica e, con la fine delle guerre 
napoleoniche, il paese é accessibile non più soltanto agli aristocratici impegnati 
nel Grand Tour, ma anche ai viaggiatori della media borghesia. Molti visitatori, 
rientrati in patria, narrano le proprie esperienze italiane, come nota John Pem- 
ble, in «Sketches, Notes, Diaries, Gleanings, Glimpses, Impressions, Pictures, 
Narratives, and Leaves from Journals about Tours, Visits, Wanderings, Resi- 
dences, Rambles, and Travels» (1987: 7). L'Italia diviene, cosi, «a major inspi- 
ration of Victorian writers» (Ibid.), e tra questi scrittori figurano, per ricordare 
solo alcunitraipiü noti, Robert Browning, Elizabeth Barrett Browning, Charles 
Dickens, Benjamin Disraeli, George Eliot, George Gissing, George Meredith, 
Algernon Swinburne, William Thackeray e Anthony Trollope. 

Le opere raccolte sino ad oggi nel corpus in inglese mettono in luce quan- 
to centrale per la cultura europea sia il testo identificato come punto di rife- 
rimento comune a tutti i gruppi di lavoro LBC, Le vite de’ più eccellenti pittori, 
scultori, e architettori di Giorgio Vasari. Pubblicato perla prima volta nel 1550, 
il libro fu rivisto e riedito con ampliamenti nel 1568 presso il tipografo fioren- 
tino Jacopo Giunti (inclusa nel corpus è la traduzione inglese di quest'ultima 
edizione, detta «la Giuntina»). Le Vite, ben nota raccolta di biografie, offre 
non solo informazioni dettagliate su opere d'arte e artisti dal tardo medioevo 
al tempo di Vasari, ma anche opinioni riguardo alla buona pratica dell'arte e, 
come d'obbligo tra i biografi dell'epoca, qualche gustoso aneddoto. Pur non 
essendo stato concepito o strutturato attorno alle Vite, allo stato attuale il sot- 
to-corpus letterario sembra ruotare a perno proprio attorno a questo testo, poi- 
ché a partire da esso rivela una rete di interconnessioni e intersezioni (in parte 
inedite) tra le opere che lo compongono. E proprio a tale rete inaspettata che 
vorrei dedicare le pagine seguenti, ricostruendone i nodi e ripercorrendone i 
fili attraverso un breve itinerario. 
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2. Un punto di partenza 


Mentre la seconda edizione del testo era in preparazione, Vasari discusse le 
Vite con l’amico Vincenzo Maria Borghini, noto storico e filologo fiorentino. In 
una lettera datata 14 agosto 1564, Borghini commento: 


Il FINE di questa vostra fatica non e di scrivere la vita de” pittori, ne di chi 
furono figl[i]uoli, né quello che e’ feciono d'ationj ordinarie; ma solo per le 
OPERE loro di pittori, scultori, architetti: che altrimenti poco importa a noi saper 
la vita di Baccio d’Agnolo o del Puntormo. E lo scriver le vite, è solo di principi 
et huominj che habbino esercitato cose da principi et non di persone basse, ma 
solo qui havete per fine l’arte et l’opere di lor mano (Vasari 1930: 102). 


Pare che Vasari abbia finito col seguire i consigli di Borghini, poiché nella 
seconda edizione delle Vite afferma di voler muovere oltre la visione atomica о 
frammentata di azioni ed esperienze del singolo, per andare alla ricerca del pro- 
cesso invisibile dell’arte o di una historia universale, in cui l’individuo è pensato 
come un punto d’incontro tra la parte e il tutto. È così che Vasari stabilisce un 
nuovo modo di guardare all’arte, secondo il quale ciascun artista diviene «im- 
pregnato» di storia, e la sua rilevanza nel quadro epocale è data non tanto dal 
genio o dal talento quanto da una congiunzione di fattori, non ultimo il proces- 
so evolutivo che il critico ricostruisce a posteriori. 

Non è superfluo ricordare, inoltre, che le Vite ha esercitato un'influenza se- 
colare sul modo in cui è stato percepito e descritto il Rinascimento italiano. 
Questa influenza, come appena menzionato, permea i primi testi inclusi nel 
sotto-corpus letterario del progetto LBC, tra i quali figurano varie opere di Ro- 
bert Browning. Egli scoprì le Vite nel 1846, nel corso dei sei mesi trascorsi a Pisa 
con la moglie Elizabeth Barrett: la coppia abitava vicino a Piazza dei Miracoli, 
in una casa progettata proprio da Vasari. In quel periodo, come testimonia Eli- 
zabeth in una lettera scritta il 13 aprile 1853 all’amica Julia Martin, entrambi 
erano «fond of digging at Vasari» (Browning 2007: 294), amavano scavare ne- 
gli interstizi delle Vite, consultando l’edizione di Gaetano Milanesi pubblicata 
tra il 1846 e il 1857. Robert usò il testo come una sorta di guida sia per visitare 
e ammirare il patrimonio artistico toscano, sia per scrivere le sue opere di am- 
bientazione italiana. 

Il monologo drammatico Fra Lippo Lippi (1855)! mette bene in luce come 
Browning abbia acquisito familiarità con l’opera e la vita del pittore e frate car- 
melitano Fra Filippo di Tommaso Lippi principalmente attraverso il testo di 
Vasari, che dell’artista scrive: 


Questa e tutte le opere menzionate di seguito sono incluse nel sotto-corpus letterario in lin- 
gua inglese del progetto LBC. Le edizioni citate nel presente contributo spesso non sono le 
stesse di quelle trascritte in formato elettronico per il corpus: qui si sono privilegiate edizio- 
ni critiche recenti, provviste di apparato critico aggiornato, mentre nel corpus la scelta delle 
edizioni è spesso legata a questioni di accessibilità. 
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Dicesi ch’era tanto venereo che vedendo donne che gli piacessero, se le 
poteva avere, ogni sua facultà donato le arebbe: e non potendo per via di mezzi, 
ritraendole in pittura, con ragionamenti la fiamma del suo amore intiepidiva. 
Et era tanto perduto dietro a questo appetito, che all'opere prese da lui quando 
era di questo umore poco o nulla attendeva (Vasari 1971: 331). 


Per mostrare questi lati del carattere di Lippi, Vasari prosegue narrando la sto- 
ria della sua fuga dall'abitazione di Cosimo de’ Mediciin preda a «furore amoro- 
so» perindulgere «a’ suoi piaceri» (Ibid.), momento che fa da sfondo a Fra Lippo 
Lippi. Tanto nelle Vite quanto nei versi di Browning, Lippi è una figura sfaccet- 
tata e complessa, caratterizzata da una passionalitá o esuberanza creativa che 
entra costantemente in conflitto con la disciplina richiesta dalla vita monastica. 

Fra Lippo Lippi abbonda di descrizioni di elementi pittorici, allusioniad opere 
d'arte e menzioni di luoghi d'interesse fiorentini, con particolare attenzione agli 
edifici associati alla storia della famiglia Medici. Ad esempio, «the house that 
caps the corner» (v. 18, Browning 2013: 485) & Palazzo Medici Riccardi, da dove 
i Medici governavano la città, «St. Laurence» (v. 67, 488) ё 1а chiesa di San Lo- 
renzo, eil «convent» che sitrova «overthe bridge» (vv. 90-91, 490), ovvero che 
sorge nell’Oltrarno, éla Chiesa di Santa Maria del Carmine, dove Lippi completó 
alcuni dei suoi primi affreschi degni di nota. Al verso 73, «Jerome knocking at 
his poor old breast» (489) sembra riferirsi all'Adorazione del Bambino con i Santi 
Gerolamo, Maddalena e Ilarione, oggi conservato presso la Galleria degli Uffizi, 
mentre quel «Something» che Lippo promette di dipingere nella Chiesa di S. 
Ambrogio con «God in the midst, Madonna and her babe» (vv. 346-48, 503-4) 
potrebbe essere l’Incoronazione Maringhi, anch'essa oggi agli Uffizi. 

Assieme a le Vite di Vasari, una preziosa risorsa per la produzione poetica di 
Browning fu la stessa città di Firenze, dove lo scrittore visse con Elizabeth Bar- 
rett dal 1847 al 1861. È nota la residenza fiorentina dei coniugi, Casa Guidi, un 
edificio del quindicesimo secolo sito in Piazza San Felice (vicino a Palazzo Pit- 
ti), che è oggi un museo. Una volta stabilitosi a Firenze, Browning iniziò a docu- 
mentarsi avidamente sulla storia artistica e culturale della città, un interesse che 
trovò massima espressione in Old Pictures in Florence. Questa poesia, concepita 
quasiinimitazione delle Vite, tratta di una serie di artisti vissuti tra il dodicesimo 
e il sedicesimo secolo: Browning menziona Giotto (vv. 15, 17,24, 133, 233, 287; 
2013: 410-34), «The Michaels and Rafaels» (v. 51, 413) e Leonardo da Vinci (v. 
64, 414), parla di «Bigordi» (conosciuto anche come Domenico Ghirlandaio, v. 
201, 425), «Sandro» (Botticelli, v. 202, Ibid.), Alesso Baldovinetti (v. 215, 426) 
e vari altri. L'attenzione, tuttavia, non é concentrata solo sulle figure piü cono- 
sciute della storia dell'arte italiana: in Old Pictures in Florence trovano spazio 
anche artisti meno noti quali Niccolo Delli (detto «Dello», v. 64, 414), Nicola 
Pisano (v. 179, 423), Lorenzo Monaco (v. 208, 425) e Margaritone o Margheri- 
tone d'Arezzo (v. 217, 426). Secondo Browning, «A younger [artist] succeeds 
to an elder brother, / Da Vincis derive in good time from Dellos» (v. 64, 414): a 
gettare le basi per la realizzazione delle grandi opere del sedicesimo secolo sono 
statii contributi di personaggi oggi considerati minori, ma non meno significa- 


47 


ILARIA NATALI 


tivi e degni di attenzione rispetto a Leonardo da Vinci. Il poeta offre, quindi, la 
propria interpretazione della storia dell’arte vasariana, che pare concepire come 
una frammentazione atta a riprodurre la pluralitá del passato in un mosaico di 
singole figure; Browning cerca di compensare ogni lacuna storica, di mettere a 
nudo anche la calce che lega i singoli mattoni e che dá forma al tutto. 

Secondo Dante Gabriel Rossetti, la competenza che Browning sviluppo nella 
storia dell’arte italiana durante il suo soggiorno fiorentino fu «superior to that 
of anyone he had ever met, including Ruskin» (Korg 1983: 100). Il termine del 
confronto scelto da Rossetti non é casuale: l'opera di Browning e quella di John 
Ruskin sono strettamente connesse, poiché i due strinsero amicizia e si influen- 
zarono reciprocamente. È naturale che il critico d'arte Ruskin conoscesse molto 
bene le Vite di Vasari; ne aveva persino disapprovato alcuni aspetti ma, dopotut- 
to, disapprovava anche la maggior parte delle opere pubblicate dai propri con- 
temporanei. Di certo, con Browning condivideva una poetica del frammento: 
difendeva il valore estetico della rovina e, nelle sue indagini della storia archi- 
tettonica, raramente discuteva degli edifici nella loro interezza (cfr. Chatterjee 
2018: 125). Tuttavia, la sua visione del passato artistico pare molto meno demo- 
cratica di quella di Browning in Old Pictures in Florence, e ruota costantemente 
attorno alla figura di Giotto, per Ruskin uno dei massimi esponenti della pittura 
naturalistica europea. L'analisi lessicale del testo Mornings in Florence, ad esem- 
pio, rivela che «Giotto» è la parola piena più frequente, con 143 occorrenze; la 
seconda parola piena, in ordine decrescente di frequenza, è «work», con sole 
95 occorrenze su 43.427 token totali. 

Mornings in Florence, come preannuncia il titolo, descrive in modo anticon- 
venzionale sei itinerari mattutini nella città di Firenze, offuscando a tratti i con- 
fini tra guida turistica, fiction letteraria e diario, ma mantenendo sempre un tono 
ironico e provocatorio. Nel parlare delle opere del Ghirlandaio in Santa Maria 
Novella, ad esempio, Ruskin suggerisce ai lettori: «Look at the Madonna, ca- 
refully. You will find she is not the least meek - only stupid, - as all the other 
women in the picture are» (1904: 26). Loriginalitä della pratica compositiva si 
riscontra anche negli appelli al lettore, frequenti e piuttosto perentori: 


Get this little bit of geography, and architectural fact, well into your mind. 
There is the little octagon Baptistery in the middle; here, ten minutes’ walk east 
of it, the Franciscan church ofthe Holy Cross; there, five minutes’ walk west of 
it, the Dominican church of St. Mary (1904: 5-6). 


Tanto la visione dell’arte di Vasari (con la mediazione di Browning) quan- 
to quella di Ruskin sono state «a major influence» per altri due testi inclusi 
nel sotto-corpus letterario LBC, The Portrait of a Lady di Henry James (1881; 
Luckhurst 2009: xiv) e A Room with a View di E. M. Forster (1908; Summers 
1987: 170-173). In particolare, Forster sembra giocare con il carattere illusorio 
dell’arte di Giotto così come spiegato da Vasari, il quale sottolinea non solo l’a- 
bilità del pittore nel creare effetti ottici, ma anche la sua propensione ad usare 
questo talento per giocare degli scherzi. In modo simile, nel secondo capitolo di 
ARoom with a View, l’Ascensione di san Giovanni di Giotto si fa una sorta specchio 
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deformante che riflette о svela concezione del mondo, vita interiore е rapporto 
con l'arte di Lucy Honeychurch, Mr. Emerson e suo figlio George, mentre visi- 
tano la Cappella Peruzzi nella basilica di Santa Croce a Firenze. 

È nuovamente il Giotto di Vasari, o meglio la sua descrizione della torre cam- 
panaria di Santa Maria del Fiore, a riecheggiare in Casa Guidi Windows (1851) 
di Elizabeth Barrett Browning. le Vite specifica che la costruzione del campani- 
le si interruppe con la morte di Giotto: 


Doveva questo campanile, secondo il modello di Giotto, avere per finimento, 
sopra quello che si vede, una punta ovvero piramide quadra alta braccia 
cinquanta, ma per essere cosa tedesca e di maniera vecchia, gli architettori 
moderni non hanno mai se non consigliato che non si faccia, parendo che stia 
meglio cosi (Vasari 1967: 115). 


In Casa Guidi Windows, Barrett Browning paragonail « Campanile» di Giotto 
aun «unperplex’d / Fine question Heaven-ward» (vv. 69-70), suggerendo che 
la sua forma incompleta sia un tributo alle aspirazioni umane e, quindi, conviene 
con Vasari sul fatto che «the tower is best as it stands, representing the beauty 
and openness ofthe future» (Pollock 2016: 168). 

La prospettiva di Elizabeth su Firenze é diversa da quella del marito Robert; 
mentre lui si dedica principalmente alla storia culturale della città, lei si occupa 
innanzitutto della politica italiana del tempo. Ne é testimonianza proprio Casa 
Guidi Windows, che, pur ricca di riferimenti all'arte e alla letteratura italiana, 
esprime anche impressioni soggettive della parlante sulla situazione della Tosca- 
na, di cui é testimone diretta ma al contempo «distante», poiché osserva tutto 
dalla finestra della propria abitazione. La particolarità di questa posizione di so- 
glia tra visione cosmica e domestica é affrontata dalla stessa Barrett Browning 
nell'Advertisement che precede la prima edizione del testo: 


This poem contains the impressions of the writer upon events in Tuscany 
of which she was a witness. ‘From a window’, the critic may demur. She bows 
to the objection in the very title of her work. No continuous narrative nor 
exposition of political philosophy is attempted by her. It is a simple story of 
personal impressions, whose only value is in the intensity with which they were 
received, as proving her warm affection for a beautiful and unfortunate country, 
and the sincerity with which they are related, as indicating her own good faith 
and freedom from partisanship (Barrett Browning 2009: 237) 


Ё Горроѕќо della «freedom from partisanship», qui dichiarata a mero scopo 
retorico-formale, a caratterizzare Casa Guidi Windows: l'osservatrice delinea i 
contorni di una nuova Italia per cui parteggia, un Italia che prende forma in mez- 
zo а chiese, piazze o monumenti, e trova espressione «’Twixt church and palace 
ofa Florence street!» (v. 10, 2009: 238), inuna perfetta commistione di passato 
e presente. Interessante notare che, benché tematicamente improntato su que- 
stioni politico-sociali, il testo di Barrett Browning é profondamente intriso di 
lessico artistico. Ben1'11,596 delle paroleimpiegate in Casa Guidi Windows sono 
indicate dall'Oxford English Dictionary come afferenti al dominio dell'arte, con 
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un divario non certo significativo rispetto al 13,1% di Old Pictures in Florence e 
al 12,5% di Mornings in Florence. In altre parole, pur non dedicandosi espressa- 
mente all’osservazione del patrimonio culturale fiorentino, Barrett Browning 
descrive i volti di donne е bambini, la processione per il Granduca Leopoldo II 
di Toscana e le tombe degli italiani come se fossero opere d’arte, fissandole in 
una eternità statica е quasi statuaria. 

Simile è la procedura adottata da Barrett Browning in altre poesie, quali A 
Tale of Villafranca, The Dance, e A Child's Grave at Florence, dove il lessico «ar- 
tistico» occupa mediamente il 12% dei testi. A Tale of Villafranca tratta della 
reazione fiorentina all’armistizio di Villafranca di Verona, firmato l’11 luglio 
1859, che pose fine alla Seconda guerra di indipendenza e ritardó il progetto 
dell'Unità italiana. Un barlume di speranza riluce nella poesia The Dance, in 
cui il «piazzone» (v. 6) presso «the Cascine» (v. 1, 2009: 277) offrelo sfondo 
per inediti e inaspettati momenti di tregua, se non di amicizia, tra i fiorentini e 
gli «invasori» francesi. Immagini di dolore e rassegnazione tornano in modo 
ancor рїй marcato in A Child's Grave at Florence, i cui versi conclusivi, dove un 
angelo giunge adanticipare una morte imminente, rovesciano il significato con- 
venzionale dell'Annunciazione: 


Some smiling angel close shall stand 

In old Correggio's fashion, 

And bear a LILY in his hand, 

For death's ANNUNCIATION 

(vv. 129-132; Barrett Browning 1849: 1304). 


Come & evidente, i temi portanti dei versi fiorentini di Barrett Browning 
sono senz'altro vari, ma tutti finiscono per essere inevitabilmente pervasi di ri- 
ferimenti alla storia dell'arte italiana: l'Annunciazione di Correggio (ca. 1524- 
1525) & un affresco staccato ora conservato nella Galleria nazionale di Parma. 
Tuttavia, l'angelo del Correggio non porta «a LILY in his hand», come nel tema 
iconografico dell'Annunciazione tipico del quattordicesimo e quindicesimo se- 
colo: nella seconda parte della strofa di A Child's Grave at Florence, sembra che 
Barrett Browning abbia in mente, piuttosto, un dipinto sul tipo dell'Annuncia- 
zione di Leonardo da Vinci (ca. 1472-1475), oggi conservato alla Galleria degli 
Uffizi di Firenze. 


3. Un punto d'approdo 


Il travelogue in versi stava ancora riscuotendo un discreto successo di letto- 
ri quando Arthur Hugh Clough, nel suo Recent English Poetry del 1853, inizid a 
mettere in guardia i propri colleghi poeti da un cambiamento nei gusti del pub- 
blico, che sempre piü spesso pareva orientarsi verso il romanzo (1964: 144). Ora 
non giova più, osserva Clough, affidarsi alla tradizione dei «poems after classical 
models», e un resoconto poetico di viaggio puó attirare lettori solo se ha a che 
fare con gli «ordinary feelings» della vita di tutti i giorni (Ibid.) E con lo stesso 
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spirito che lo scrittore aveva giä composto Amours de Voyage (1849; pubblicato 
nel 1858), in cui rivedeva i canoni del diario di viaggio tradizionale. Come Bar- 
rett Browning, Clough sceglie di dare un'impronta politica alle proprie opere, 
anziché soffermarsi sugli splendori dell'arte italiana, relegata a fare da sfondo 
agli eventi del Risorgimento: 


Is it Florence we follow, or are we to tarry yet longer, 

E'en amid clamour of arms, here in the city of old, 

Seeking from clamour of arms in the Past and the Arts to be hidden, 
Vainly ‘mid Arts and the Past seeking one life to forget? 

(vv. 341-344; Clough 2003: 154, corsivo originale) 


Il romanzo epistolare in versi Amours de Voyage & suddiviso in cinque canti 
(o capitoli) dedicati alle vicende di un gruppo di viaggiatori inglesi coinvolto nei 
tumulti politici italiani del 1849. Non c'é dubbio che l'esperienza personale di 
Clough sia stata d'ispirazione all'opera: anch'egli, nella primavera dello stesso 
anno, intraprese un tormentato viaggio in Europa. Pare che Giuseppe Mazzini, 
allora a capo della Repubblica romana e alle prese con i conflitti con la Francia, 
fosse improvvisamente preso d'assedio anche su un diverso fronte: uno scono- 
sciuto poeta inglese insisteva per ottenere da lui il permesso firmato per visitare i 
Musei vaticani. Tempo dopo, Clough confessò di essersi sentito in imbarazzo di 
«bother the Dictator [...] with my trivial English-tourist importunities» (1957: 
257). Si tratta forse di un imbarazzo provato a posteriori, maturato quando il 
poeta ha iniziato a domandarsi se ammirare il patrimonio artistico italiano fos- 
se occupazione consona ad un momento tanto cruciale della storia europea. E 
da questa domanda che nasce la sua opera рїй conosciuta. 

Clough é morto nel 1861 a Firenze, dove si era ritirato per problemi di salute, 
ma a Firenze è sempre rimasto uno «straniero», cosi come nelle altre sue tappe 
italiane ed esperienze all'estero. La sua opera é lontana dall'appassionato coin- 
volgimento politico di Barrett Browning, e Amours de Voyage sembra tradire un 
senso di perplessità e incertezza nei confronti dei progetti di unificazione della 
penisola, piuttosto che genuina partecipazione. In rapporto analogo con l'Italia 
sié postaanche George Eliot (Mary Ann Evans) che, a differenza dei Browning, 
non è mai stata «a casa» a Firenze. Vi trascorse solo sei settimane nel 1861, racco- 
gliendo il materiale che poi sarebbe confluito in Romola (1863), oggi forse l’opera 
meno conosciuta dell’autrice. Questo romanzo storico è ambientato a Firenze tra 
il 1492 e il 1498, due date ricche di significato: la prima coincide con la morte di 
Lorenzo de’ Medici, la seconda con quella di Savonarola. Si tratta di anni segnati 
da instabilità politica, che poi condussero alle cosiddette Guerre d’Italia (1494- 
1559); è evidente che Eliot percepì delle similitudini tra la situazione dell’Italia 
del Quattrocento e quella dell'Ottocento, epoca delle guerre d’indipendenza 
(1848-1870). Romola stabilisce connessioni tra passato e presente proprio attra- 
verso il patrimonio culturale fiorentino sin dalle sue prime pagine: 


The Loggia de’ Cerchistoodinthe heart ofold Florence, within alabyrinth of 
narrow streets behind the Badia, now rarely threaded by the stranger, unless in a 
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dubious search for a certain severely-simple door-place, bearing this inscription: 
QUI NACQUE IL DIVINO PORTA (Eliot 1863: 9). 


Il presente della storia ё, come abbiamo detto, il 1492; il «now» della narra- 
zione, invece, è verosimilmente il tempo di Eliot, quando la Loggia de’ Cerchi 
ha cessato di essere un'area particolarmente trafficata della città. La connessione 
inattesa tra il prima eil dopo suggerisce al lettore che, nonostante i cambiamen- 
ti, la storia che sta per leggere é rilevante anche per la propria epoca. In effetti, 
sono vari gli studiosi che leggono il romanzo come un’allegoria non solo della 
situazione italiana contemporanea ad Eliot, ma soprattutto dell'era vittoriana 
inglese nel suo complesso (cfr. Morse 1993: 351). 

Riprendo qui un filo momentaneamente spezzato del discorso: non susci- 
terà sorpresa, a questo punto, apprendere che anche il romanzo Romola possa 
dirsi profondamente indebitato alle Vite. William Sullivan nota che Eliot lesse 
l'opera di Vasari nel 1861, probabilmente nel corso della propria permanenza a 
Firenze, e ne trasse spunti importanti per delineare il personaggio di Piero di 
Cosimo (1972: 391). Secondo Vasari, il Piero storico «teneva una vita da uomo 
più tosto bestiale che umano», era «capriccioso e di stravagante invenzione» 
ma «non [...] piacevole per la sua vaghezza» (1976: 61-63). Questa figura dal 
carattere impossibile, costantemente in preda a manie e paure, dovette affasci- 
nare Eliot, che parimenti descrive il «suo» Piero come un uomo «freakish», 
«whimsical» e «crusty» (1863: 21, 43, 117). Tuttavia, nel romanzo queste ca- 
ratteristiche vanno a costituire solo l'apparenza esteriore, una patina superfi- 
ciale cinica e scontrosa del personaggio, dietro la quale si celano grande lealtà 
e onestà d'animo, assieme ad altri tratti che sono pura invenzione dell'autrice. 
Eliot si appropria della figura storica di Piero di Cosimo, la rilegge ela trasforma, 
poiché il suo scopo non é tanto restare fedele ai fatti del passato, quanto stru- 
mentalizzarli a fini morali. E a questo proposito che Romola trova dei punti di 
contatto significativi anche con il pensiero di Ruskin: nel Rinascimento italiano 
quest'ultimo vedeva l'inizio di un declino morale dovuto agli eccessi, ivi inclu- 
si «over-refinement» e «over-luxuriance» (Ruskin 1979: 4). In chiave simile, 
Eliot enfatizza la corruzione, dissolutezza e amoralità di un periodo e un luogo 
in cui «lustand obscenity, lying and treachery, oppression and murder, were ple- 
asant, useful, and, when properly managed, not dangerous» e «sublime artists 
were at hand to paint the holy and the unclean with impartial skill» (1863: 95). 

La rete di interconnessioni tra testi del sotto-corpus letterario, di cui si sono 
discussi qui solo alcuni nodi fondamentali, si estende anche oltre, e si amplierà ul- 
teriormente nell'immediato futuro con l'inserimento di nuovi testi: ad esempio, 
Handbook for Travellers in Northern Italy, Part II: Parma, Piacenza, Modena, Floren- 
ce, Pisa, Lucca and Tuscany di John Murray, spesso citato (e criticato) da Ruskin, e 
le opere su Firenze di Bernard Berenson, dalle quali E.M. Forster molto ha tratto 
perla composizione di A Room with a View. Per quanto ancora in fase di sviluppo, 
il sotto-corpus letterario non é solo utile per l'indagine linguistica, ma anche per 
quella storica e culturale: racconta soprattutto di quel secolo che ha visto un nu- 
mero di residenti stranieri a Firenze mai eguagliato prima nella storia della città. 
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Abstract (Italiano): In questo contributo si presentano le caratteristiche principali e le 
possibili applicazioni del Corpus LBC tedesco, creato nell'ambito del progetto Lessico 
multilingue dei Beni Culturali (LBC). Il lavoro si compone di tre paragrafi: il primo paragrafo 
disamina i generi testuali, gli autori e i titoli presenti nel corpus, illustra i criteri di selezione 
adottati per la loro scelta e propone una valutazione dell'attuale configurazione del corpus. 
Successivamente (par. 2) ci si sofferma sui possibili usi del corpus, mettendo in evidenza 
come esso si presti ad analisi di tipo sia intralinguistico sia interlinguistico, applicabili sia 
in ambito didattico sia in contesti professionali. Chiudono il lavoro un riassunto e uno 
sguardo sulle prospettive di sviluppo futuro (par 3). 


Parole chiave: linguistica dei corpora, didattica DaF, lessico, terminologia, arte, beni 
culturali. 


Abstract (English): This essay describes the main features of the German LBC corpus, 
which was compiled within the research project Lessico multilingue dei Beni Culturali 
(LBC) and illustrates its possible applications. The paper is divided into three sections: 
Section 1 illustrates the German LBC corpus, paying special attention to the selected 
text genres and authors and their selection criteria; it also proposes an evaluation of the 
current corpus configuration. Section 2 presents various possible applications of the 
corpus: The proposed applications are both intralingual and interlingual. Conclusion and 
outlook (Section 3) conclude the work. 


Keywords: Corpus Linguistics, German as Foreign Language Teaching, Lexicon, 
Terminology, Art, Cultural Heritage. 


1. Il corpus tedesco di LBC. Costruzione 


La piattaforma del corpus LBC (<http://corpora.lessicobeniculturali.net>) 
é una piattaforma multilingue specializzata composta da corpora monolingui 
in рїй lingue (tedesco, inglese, francese, italiano, russo, spagnolo), contenente 


Il presente contributo è la traduzione di un più ampio saggio in tedesco dal titolo Das deutsche 
LBC-Korpus: Zusammenstellung und Anwendung, pubblicato in Ballestracci, Buffagni, Flinz 
2020. Autrice della traduzione è Sara Congregati. Come il saggio in tedesco, così anche il 
presente contributo è frutto della concezione comune delle tre autrici, che ne hanno discusso 
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sia testi originali sia traduzioni (cfr. Farina, Garzaniti 2013; Farina 2016; Bille- 
ro, Martinez 2017; Billero, 2020; cfr. anche Figura 1): 


Corpus LBC Italiano 
Corpus LBC Russo. 
- Маке Сопсогдапсе 


Lexical x Computing 
open-2.158.8-open-3.105.1 


Figura 1. Screenshot dei corpora LBC nell’ambiente NoSketchEngine. 


Scopo principale del progetto LBC ё la redazione di un dizionario multi- 
lingue in rete, che possa anche servire da fonte per ricerche scientifiche (lin- 
guistiche, letterarie, culturali ecc.), offrendo al largo pubblico testi per una 
migliore conoscenza dei Beni culturali italiani. La banca dati, dunque, non 
solo é funzionale alla creazione di un dizionario da parte dell’unita di ricer- 
ca LBC, ma si rivolge anche a utenti esterni, come esperti del settore in storia 
dell’arte, italianistica ecc., traduttori professionisti, e anche insegnanti di tra- 
duzione specialistica. 

E a partire da queste premesse che i singoli corpora LBC mirano a illustra- 
re il lessico dei Beni culturali italiani. Per questa ragione si é posta fin dall’ini- 
zio particolare attenzione sulla lingua del Rinascimento e dell’arte fiorentina, 
nonché sulle sue opere e i suoi autori famosi (cfr. paragrafo 1.1 e paragrafo 1.2). 


1.1 Generi testuali 


Il corpus tedesco di LBC - come gli altri corpora LBC - si compone sia di 
testi in lingua originale tedesca sia di testi tradotti da altre lingue del progetto 
(italiano, francese e inglese?). Di questitesti alcuni erano disponibiliin versione 
cartacea nelle nostre biblioteche universitarie o private, altri sono stati scaricati 
da archivi testuali online. Delle fonti online impiegate fanno parte rinomati ar- 
chivi testuali come, per esempio, il Deutsches Textarchiv («http://ww w.deutsche- 


in dettaglio le singole parti. Sabrina Ballestracci ha curato in particolare i paragrafi 1.1 e 1.2, 
Claudia Buffagni il paragrafo 1.3, Carolina Flinz il paragrafo 2. Alla stesura del paragrafo 3 
e del cappello del paragrafo 1 hanno collaborato tutte e tre le autrici. Desideriamo qui rin- 
graziare Katharina Müller e Anna Nissen per gli utili spunti di riflessione e i suggerimenti 
offerti nel corso di uno scambio proficuo. 


Im 


Fanno parte dell'intero progetto anche altre lingue straniere, in particolare lo spagnolo e 
il russo; il corpus tedesco di LBC già caricato online non contiene tuttavia testi tradotti da 
queste lingue (cfr. anche fig. 6 nel paragrafo 1.2). Un ampliamento del corpus in tal senso 
sarà uno degli obiettivi delle prossime fasi di lavoro (cfr. paragrafo 1.3 e paragrafo 3). 
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stextarchiv.de/>), che dispone soprattutto di testi in formato PDF, e il Projekt 
Gutenberg (<https://www.projekt-gutenberg.org/index.html>), dove tutti i te- 
sti sono presenti in formato HTML. I testi in versione cartacea sono stati scan- 
nerizzati e dunque importati in file PDF. Tutti i file PDF - sia quelli attinti da 
fonti internet, sia quelli di provenienza cartacea — sono stati convertiti in for- 
mato Word tramite OCR, i testi del sito web del Progetto Gutenberg sono stati 
copiati direttamente in un file Word’. Ogni singolo esemplare testuale è stato 
sottoposto a revisione formale, ovvero linguistica. 

Attualmente il corpus tedesco di LBC contiene 763 file Word (in totale 
1.183.484 token)*, che sulla base del genere testuale di appartenenza possiamo 
suddividere in tre macrocategorie: divulgativa, tecnico-specialistica eletteraria 
(cfr. Tabella 1 e Figura 2). 


Tabella 1. Ripartizione dei token nelle tre macrocategorie (frequenza assoluta). 


Categorie Frequenza assoluta 
Divulgativa 17.450 
Tecnico-specialistica 526.516 
Letteraria 639.518 

Totale 1.183.484 


Generi testuali nel corpus LBC di tedesco 
196 


W divulgativo W letterario M tecnico-specialistico 


Figura 2. Ripartizione dei token nelle tre macrocategorie (percentuale). 


? Perla realizzazione di questa prima fase della ricerca è stato fondamentale il lavoro di 


dottorandi e tirocinanti dell'Università di Firenze. Il nostro particolare ringraziamen- 
to va qui alla dott.ssa Benedetta Bronzini, alla dott.ssa Sara Congregati, a Valentina 
Baldi, Domenica Barone, Delia Papandrea, Maria Chiara Susini, Clara Sabatino, Giulia 
Giannattasio e Lisa Bandinelli. 

Le cifre si riferiscono allo stato del corpus al 31 agosto 2018 (cfr. anche paragrafo 3.1). Da 
allora il corpus tedesco di LBC è stato fortemente ampliato; i nuovi testi elaborati non sono 
tuttavia ancora disponibili online. Raggiunta quota 1.000.000 di token, il corpus online 
non è stato ulteriormente incrementato per permettere di ancorare il lavoro sulle concor- 
danze a una raccolta di testi circoscritta (cfr. Flinz, Buffagni, Ballestracci 2020). Tale deci- 
sione è estesa a tutte le lingue del progetto. 
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Tabella 1 е Figura 2 mostrano che il genere рїй rappresentato nel corpus 
tedesco e quello letterario (54%). Ben rappresentato & anche il genere tecnico- 
specialistico con una percentuale del 45%. I meno rappresentati nel corpus LBC 
tedesco sono i testi divulgativi con una percentuale dell’1%. 

Rientrano nei testi di genere letterario biografie, opere narrative e saggi se- 
condo la ripartizione qui di seguito illustrata (Figura 3): 


Generi testuali letterari 


E 


W letterario-biografico 
Ш letterario-narrativo 
Wi letterario-saggistico 


Figura 3. Ripartizione dei testi letterari nelle tre categorie (percentuale). 


Come possibile osservare in Figura 3, la categoria più ampia, con una per- 
centuale del 55%, è la biografia, mentre le altre due categorie letterarie — fiction 
e saggistica — presentano una percentuale più bassa, pressoché equivalente (ri- 
spettivamente del 25% e del 20%). 

Rientrano nei testi biografici sia biografie vere e proprie sia testi più vicini 
ad altri generi testuali, per esempio diari e resoconti di viaggio. Questo gruppo 
di testi accoglie in egual misura testi in traduzione — per esempio dall’italiano 
Das Leben des Benvenuto Cellini, florentinischen Goldschmieds und Bildhauer. Von 
ihm selbst geschrieben (2016)? di Benvenuto Cellini – oppure dal francese - Rei- 
se in Italien (Rome, Naples et Florence en 1817) (1922) di Stendhal — così come 
testi originali in lingua tedesca, ad esempio Das Florenzer Tagebuch (1984) di 
Rainer Maria Rilke. 

Si annoverano fra i testi di fiction novelle, romanzi e altri testi di narrativa 
letteraria dove Firenze o la Toscana sono al centro o sullo sfondo delle vicende 
narrate. All’interno di questa categoria figurano soltanto testi di autori tedesco- 
foni. Ne sono un esempio Florentiner Novellen (1984) di Isolde Kurz o Florenti- 
nische Nächte (1969) di Heinrich Heine. 

Anche i testi di saggistica includono soltanto testi in lingua originale tede- 
sca, per esempio Stadt des Lebens (1905) di Isolde Kurz, oppure Geschichte der 
Renaissance in Italien (1891) di Jacob Burckhardt. 

La categoria dei testi tecnico-specialistici comprende testi di varia prove- 
nienza settoriale: arte, enogastronomia e storia (cfr. Figura 4): 


* Daquiin poile indicazioni bibliografiche fanno riferimento alle edizioni dei testi contenuti 


nel corpus. 
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Generi testuali tecnico-specialistici 


| 
| 


0% 20% 40% 60% 80% 100% 


Bl tecnico-artistico Btecnico-enogastronomico Btecnico-storico 


Figura 4. Ripartizione dei testi tecnico-specialistici (percentuale). 


Un’alta percentuale è rappresentata dai testi tecnico-specialistici di arte (oltre 
500.000 token; 9896). I testi tecnico-specialistici di enogastronomia e di storia 
sono invece molto poco rappresentati (in totale 11.134 token; 296). 

I testi tecnico-specialistici mostrano una varietà minore rispetto a quelli let- 
terari: sitratta esclusivamente di traduzioni dall'italiano, come per esempio Der 
Traktat von der Malerei (1909) di Leonardo da Vinci, Kleinere kunsttheoretische 
Schriften (1877) di Leon Battista Alberti, Von der Wissenschaft des Kochens und 
der Kunst des Geniessens (2000) di Pellegrino Artusi e Geschichte von Florenz 
(1934) di Niccoló Machiavelli. 

Per quanto riguarda i testi divulgativi abbiamo al momento un unico esem- 
plare: si tratta di una buona guida turistica, relativamente esaustiva (17.412 to- 
ken) inlingua originale tedesca, Florenz. Perfekte Tage in der Toskana - Metropole 
(2016) di Ciccarelli, Jepson e Fisher‘. 

La scelta dei testi é stata spesso influenzata dalla reperibilità degli stessi; 
ciononostante abbiamo tentato di garantire una certa varietà per tutti i generi 
letterari, privilegiando quelle tipologie testuali particolarmente importanti per 
le finalità del progetto. Per quanto possibile, sono stati rispettati criteri quali la 
paternità e l'importanza dell'opera per la cultura e l'arte italiana, come pure la 
diffusione e la ricezione a livello internazionale. Nel caso di alcuni esemplari 
l'attribuzione del genere testuale di appartenenza ha presentato non poche dif- 
ficoltà al gruppo di lavoro. Basti solo citare, a titolo esemplificativo, l'opera di 
Giorgio Vasari (1966 [1568]), che rappresenta il testo fondante del progetto, ov- 
vero il testo da cui le singole unità di ricerca - divise per lingua — sono partite 
per l'acquisizione dei dati (edizione tedesca: Leben der ausgezeichnetsten Maler, 
Bildhauer und Baumeister von Cimabue bis zum Jahre 1567, 2008). Questi testi — 
come altri del corpus - sono caratterizzati da una forte commistione di generi 
testuali, il cui stile oscilla fra lo specialistico-descrittivo, il biografico-narrativo 
e il critico-valutativo. Il testo & stato attribuito alla categoria del genere tecni- 


5 Inuna prima fase di lavoro sono state prese in esame anche altre guide turistiche in seguito 


escluse di necessità dal corpus per mancanza di informazioni sulle caratteristiche della lin- 
gua impiegata (se per esempio da traduzione o da testo originale). 
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co-specialistico, da un lato, per il criterio delle peculiaritä stilistiche prevalen- 
ti, dall’altro, per il criterio dello scopo insito nel progetto stesso. Quest’ultimo 
criterio ha guidato progressivamente anche la scelta dei singoli autori e delle 
singole opere presenti nel corpus (cfr. paragrafo 1.2). 


1.2 Autori e opere 


Nel selezionare gli autori ele opere che costituiscono il corpus LBC abbiamo 
scelto di privilegiare quelli particolarmente rappresentativi perl'arte e la cultura 
del Rinascimento. Con questo intento tutti i gruppi di lavoro LBC sono partiti 
all'inizio del progetto da Giorgio Vasari e dalle sue Vite (1550, 1568), cioè da 
un'opera fondamentale per l'arte e la cultura del Rinascimento, che ha contri- 
buito alla diffusione del mito del Rinascimento italiano in gran parte dei Paesi 
europei - anche in ambito tedescofono (cfr. Wackenroder 1991 [1797]; Fiorillo 
1798; cfr. anche Ballestracci, Buffagni 2016). Questo si è rivelato un vantaggio 
perl'intero progetto, anche perché l'opera di Giorgio Vasari esiste in tutte le lin- 
gue comprese nel progetto (italiano, tedesco, inglese, francese, spagnolo, russo 
e cinese), cosa che in futuro potrebbe anche consentirci di costruire un corpus 
parallelo delle Vite per ulteriori ricerche (cfr. paragrafo 1.3 e paragrafo 2). Fra 
le altre opere e gli altri autori italiani che abbiamo scelto per il nostro corpus 
vi sono le Opere Volgari (1849) di Leon Battista Alberti, il Trattato della pittura 
(1651) di Leonardo da Vinci ele Istorie Fiorentine (1971) di Niccold Machiavelli. 
Si é cercato, per quanto possibile, di ritrovare gli stessi autori in tutte le lingue. 

Siritengono fondamentali per il progetto anche autori non italiani che hanno 
avuto un ruolo di rilievo nella diffusione della cultura italiana del Rinascimento 
nei Paesi stranieri: ne fanno parte per esempio testi tradotti da altrelingue come 
Wege zur Kunst (1897) di John Ruskin o testi in lingua originale tedesca come 
Die Geschichte der Renaissance in Italien (1891) di Jacob Burkhardt". 

Un altro gruppo importante é rappresentato da autori o letterati famosi che 
hanno fatto viaggi in Italia e hanno scritto un diario o un resoconto di viaggio. 
Laloro importanza risiede soprattutto nel fatto di aver descritto l'arte e la cul- 
tura italiane con occhi stranieri, contribuendo cosi alla diffusione dei Beni cul- 
turali e artistici soprattutto nel XIX secolo, ma anche fino ai giorni nostri, in 
realtà. Fra gli autori di testi letterari del corpus LBC tedesco si annoverano let- 
terati famosi come, per esempio, Johann Wolfgang Goethe (Italienische Reise, 
1997), Karl Philipp Moritz (Reisen eines Deutschen in Italien in den Jahren 1786 
bis 1788, 2015), Fanny Lewald (Bilderbuch, 1992), Karl Eugen Gass (Pisaner Ta- 
gebuch. Aufzeichnungen/Briefe, 1961) e Stendhal (Reise in Italien (Rom, Naples 
et Florence en 1817), 1922). 


7 Lopera di Burckhardt nel corpus LBC tedesco non figura ancora in versione integrale a cau- 


sa delle varie impurità del file Word importato dal formato PDF, che hanno pesato non poco 
sulla revisione formale e linguistica del testo. 
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Per tutti gli autori e le loro opere sono stati scelti nelle prime fasi di lavoro 
solo braninei quali spiccano Firenze, la Toscana e l'arte del Rinascimento. I cri- 
teri inizialmente adottati sono stati in seguito ampliati: da un lato, si ё deciso di 
prendere in considerazione non solo Firenze e la Toscana ma l'Italia tutta, pur 
mantenendo al centro dell’attenzione l’arte e la cultura; dall'altro, sono stati presi 
in esame non solo l'arte e la cultura del Rinascimento ma anche l’arte e la cultura 
di altre epoche storiche. Per questo il corpus da noiimpiegato perl’elaborazione 
delle concordanze (cfr. Buffagni, Flinz, Ballestracci 2020) e qui descritto è l'im- 
magine del corpus in un dato momento, cosi come rappresentato in Figura 5: 


Word list 


Corpus: Corpus LBC Tedesco 
Total number of items: 18 
Total frequency: 763 


doc.author document frequency 
Cellini, Benvenuto 237 
Kurz, Isolde 169 
Vasari, Giorgio 126 
Moritz, Karl Philip 66 
Artusi, Pellegrino 46 
Rilke, Rainer Maria 25 
Ciccarelli, Jepson, Fisher 21 
Brandi, Karl 18 
Heine, Heinrich 12 
Burckhardt, Jacob 10 
Alberti, Leon Battista 7 
da Vinci, Leonardo 7 
Lewald, Fanny 6 
Ruskin, John 4 
Stendhal 3 
Gass, Karl Eugen 3 
Machiavelli, Niccolo 2 
Goethe, Johann Wolfgang von 1 


Figura 5. Autori nel corpus LBC tedesco. 


Come evidenziato in Figura Silcorpus LBC tedesco comprende in totale 18 
autori: di questi, dieci sono tedeschi (Kurz, Moritz, Ciccarelli, Jepson e Fisher, 
Brandi, Heine, Burckhardt, Gass e Goethe), mentre i restanti otto sono o italiani 
(Cellini, Vasari, Artusi, Alberti, da Vinci e Machiavelli) o di altre lingue, come 
Stendhal (francese) e Ruskin (inglese) (cfr. Figura 6). 


Word list 


Corpus: Corpus LBC Tedesco 
Total number of items: 4 
Total frequency: 763 


doc.language document frequency 
Italiano 425 
Tedesco (Germania) 331 
Inglese (Regno Unito) 4 
Francese (Francia) 3 


Figura 6. Lingue di partenza rappresentate nel corpus LBC tedesco. 


LaFigura 6 mostra come dal corpus LBC tedesco restino ancora esclusi testi 
intraduzione da alcune lingue del progetto (es. spagnolo, russo e cinese); queste 
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dovranno venir prese in considerazione nelle prossime fasi di lavoro. Allo stato 
attuale il corpus LBC tedesco offre tuttavia testi che garantiscono una varietà 
diacronica relativamente ricca, essendo stati scritti o pubblicati fra il 1400 e il 
2016 (cfr. Figura 7). 


Word list 

Corpus: Corpus LBC Tedesco 
Total number of items: 19 
Total frequency: 763 


doc.writingYear document frequency 


1400 7 
1519 2: 
1526 2 
1558 237 
1568 127 
1786 1 
1788 66 
1800 4 
1817 8 
1836 12 
1847 6 
1867 10 
1890 41 
1891 45 
1898 43 
1902 42 
1910 86 
1938 3 
2016 21 


Figura 7. Lingue di partenza rappresentate nel corpus LBC tedesco. 


Pur necessitando di alcuni interventi per vari aspetti, il corpus LBC tedesco 
evidenzia altrettanti aspetti che allo stato attuale non possono che trovare una 
valutazione positiva (cfr. paragrafo 1.3). 


1.8 Lo stato attuale del corpus. Prime conclusioni 


Riassumendo, la piattaforma del corpus LBC mira, unitamente alla redazio- 
ne di un dizionario multilingue in rete, alla reperibilità di testi rilevanti per la 
conoscenza dei Beni culturali italiani, cosi da offrire una fonte liberamente ac- 
cessibile per ricerche di tipo linguistico, letterario e culturale. 

Come si evince dal paragrafo 1.1, più della metà dei testi compresi nel corpus 
appartiene al genere letterario, la quasi totalitá dei testi rimanenti é riconduci- 
bile invece al genere tecnico-specialistico, e solo una minima parte al settore 
divulgativo. Tale configurazione potrebbe a prima vista apparire non del tutto 
equilibrata per la preponderanza dell'ambito letterario. Vanno tuttavia sottoli- 
neate innanzitutto le motivazioni anche genetiche dell'attuale configurazione 
della banca dati: la maggior parte dei testi letterari presenti provengono infatti 
da archivi online molto prestigiosi e facilmente accessibili; cosi non & per molti 
dei testi tecnico-specialistici. E sembrato dunque sensato nella prima fase di la- 
voro partire dalla raccolta dei testi letterari. La struttura attuale della banca da- 
ti che, come evidenziato, registra la situazione del corpus in un dato momento, 
corrisponde dunque in primo luogo a questo modo di procedere. 
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La bonta della decisione presa si é palesata anche in un'altra ottica. Dei te- 
sti letterari del corpus LBC tedesco va notato innanzitutto che si contraddi- 
stinguono per la loro varietà: includono prevalentemente biografie, la restante 
parte é data invece dalla somma dei generi testuali di fiction e saggistica. Le 
biografie assumono pertanto un'importanza notevole, a queste sono stati in- 
fatti aggiunti i testi di viaggio. Come nel caso delle altre lingue rappresentate 
nella banca dati (es. il francese), le descrizioni e i resoconti di viaggio svolgo- 
no sul piano sia quantitativo che qualitativo un ruolo particolare in relazione 
agli obiettivi del corpus LBC tedesco: quantitativo, poiché (cfr. paragrafo 1.2) 
costituiscono una parte cospicua del corpus; qualitativo, in quanto riportano 
la prospettiva di osservatori stranieri di fronte alle opere d'arte italiane, e fio- 
rentine in particolare (si tratta spesso di viaggiatori del XVIII e XIX secolo, co- 
me, per esempio, il consigliere segreto Goethe o l’irrequieto soldato Stendhal). 
Le descrizioni che scrittori e artisti tedeschi, francesi e inglesi hanno dedicato 
alle opere d'arte italiane sono testimonianze dell'epoca e della vita degli auto- 
ri; possiedono un elevato valore letterario e hanno contribuito alla ricezione 
dell'immagine dell'Italia nel mondo. Hanno infine portato alla creazione di 
un vero e proprio «mito dell'Italia» che avrà ampie ripercussioni sull'arte ela 
cultura europea ed extraeuropea. Ricordiamo fra questi anche Wege zur Kunst 
(1897, traduzione dall'inglese) di Ruskin. Le altre biografie presenti nel corpus, 
che comprendono le vite degli artisti del Rinascimento, si presentano da parte 
loro come «tratteggio di un percorso di vita» e sono ascrivibili a un'epoca piü 
antica (per esempio le Lebensbeschreibungen di Vasari e l'autobiografia di Cel- 
lini). Opere architettoniche, sculture, dipinti, affreschi, stucchi e ornamenti 
vengono descritti e valutati rispettivamente secondo criteri indicati dagli au- 
tori. Queste opere comprendono «elementi [...] di storiografia e letteratura» 
(Best 1994, 71) e contengono a tal riguardo preziose informazioni storiche. 
Entrambe le tipologie di genere biografico possiedono un inestimabile valore 
storico-culturale, poiché permettono di comprendere lo sviluppo della storia 
dell'arte, come pure della storiografia dell'arte, fra il XV secolo e il presente. 

Nel corpus si trovano anche, classificati come generi letterari — nella sottoca- 
tegoria dei testi di saggistica - classici moderni della storiografia dell'arte come la 
Geschichte der Renaissance in Italien (1891) di Burckhardt. L'opera di Burckhardt, 
che ha avuto un'influenza notevole su altri autori presenti nel corpus (es. Isol- 
de Kurz), si distingue per le neoacquisite conoscenze scientifiche dell'epoca e 
offre un'immagine dell'arte del Rinascimento ancor piü ricca di sfaccettature. 
Sul piano stilistico mostra un lessico variegato, duttile, che accanto ai termini 
tecnici presenta anche peculiarità estetiche. 

Sono poi da menzionare come generi di fiction con valore prototipico in am- 
bito letterario i testi narrativi presenti nel corpus, fra cui il racconto Florentini- 
sche Nächte di Heinrich Heine (1969) e il ciclo di novelle Florentiner Novellen 
(1984) di Isolde Kurz. La città di Firenze con gli usi e costumi della sua popola- 
zione fanno spesso da sfondo alle storie narrate, il cui ampio spettro di varianti si 
esprime, fra l'altro, nella possibilità di venir ambientate in epoche passate (come 
nelle novelle di Kurz) o nel presente (come nel racconto di Heine). 
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Fraigeneritestualitecnico-specialistici, tuttiin traduzione, spiccano in parti- 
colare i Kleinere kunsttheoretische Schriften (1877) di Leon Battista Alberti e Traktat 
von der Malerei (1909) di Leonardo da Vinci: ilprimo segna una svoltaimportante 
nella storiografia dell’arte dell'epoca, avendo introdotto un lessico tecnico inno- 
vativo (architettura, scultura е pittura); l’altro rappresenta una riflessione appro- 
fondita sull'essenza della pittura che proprio all'epoca vuole affermarsi accanto 
alla poesia come arte di pari dignità (Gombrich 2000). La Geschichte von Florenz 
(1934) di Niccoló Machiavelli costituisce l’unico testo tecnico di contenuto sto- 
rico, mentre Von der Wissenschaft des Kochens und der Kunst des Geniessens (2000) 
di Pellegrino Artusi ё il solo testo dedicato alla gastronomia. Si tratta in entrambi i 
casi di opere di grande valore culturale. A questo proposito sirivelano rappresenta- 
tivi per un lungo lasso di tempo (dal 1400 al 1891) anche i generi testuali tecnico- 
specialistici che occupano quasi la metä del corpus, mentre si annovera fra i testi 
divulgativi una guida turistica contemporanea in lingua tedesca, Florenz. Perfekte 
Tage in der Toskana - Metropole (2016) di Ciccarelli, Jepson e Fisher. 

Come emerge chiaramente da quanto argomentato sopra, la stragrande mag- 
gioranza dei testi presenti nel corpus & accomunata da un elevato valore stilistico 
che contraddistingue la banca dati multilingue e il corpus tedesco. Proprio lo stile 
alto possiede un valore intrinseco ed é rilevante soprattutto per la storia dell'arte e 
la storiografia artistica. Non a caso Reiners contrappone allo «stile enciclopedico 
privo di visione» il «testo creato da un buon scrittore di prosa», per giungere alla 
conclusione: «Le opere di storia dell'arte contrappongono immagini di uno stile 
[dello stile vivace, plastico, n.d.a.] all’altro [lo stile enciclopedico, n.d.a.] permetterne 
in risalto le peculiarità. Anche nel regno della parola la bellezza della grande prosa 
risalta con maggior chiarezza sullo sfondo dello stile medio*» (Reiners 1991, 219 s.). 

E quanto piü diversi tra loro si presentano i generi, tanto piü ricca si rivela 
la stragrande maggioranza dei testi all'interno del corpus. Da un punto di vista 
qualitativo il corpus é da considerarsi adeguato agli obiettivi perseguiti. Come 
annunciato nel paragrafo 1.2, nelle prossime fasi di lavoro la prospettiva verrà 
ulteriormente ampliata sul versante dello spazio (a tutta l'Italia) e su quello del 
tempo (all'arte e alla cultura di altre epoche); ci si concentrerà, anche in futuro, 
sulla qualità stilistica e sul valore storico-culturale dei testi. 

Va inoltre aggiunto che, soprattutto in virtù della propria costituzione testua- 
le, il corpus rappresenta una miniera linguistica inesauribile: le prime ricerche 
effettuate con approcci differenti hanno dimostrato di condurre all’acquisizione 
di conoscenze fruttuose su numerosi fenomeni linguistici (es. lessicali, sintatti- 
ci, testuali, traduttivi, cfr. paragrafo 2)? 


Con «stile medio» Ludwig Reiners intende il tipico stile enciclopedico che egli critica come 
astratto e «privo di visione». Agli antipodi troviamo la grande prosa. Secondo l’autore il 
«buon scrittore di prosa» porta a compimento un lavoro significativo che richiede molta for- 
za d'immaginazione e conoscenza del mondo per riprodurre complessi processi mentali e 
renderli vivi (Reiners 1991: 219). 

Vanno qui menzionate anche numerose tesi triennali redatte a Firenze e a Siena e incentrate 
sul testo di Vasari o su altri testi del corpus LBC. 
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2. Possibilita applicative del corpus 


La piattaforma LBC (<http://corpora.lessicobeniculturali.net/de/>) mette 
a disposizione i vari corpora del progetto (tedesco, inglese, francese, italiano, 
russo, spagnolo) permettendo la loro consultazione tramite NoSketchEngine 
(versione ridotta di SketchEngine'%). Gli utenti possono analizzare il corpus! 
fruendo di diverse funzionalità, come Wordlist con la quale si possono estrar- 
re liste di parole sulla base della frequenza assoluta (parole, lemmi, tags ecc.), 
Concordance con la quale si possono analizzare singole/i parole/lemmi nelloro 
contesto (Keywords in Context) e Collocations con la quale si possono identifi- 
care possibili collocazioni di un lessema (cfr. Kilgarriff et al. 2004; Kilgarriff ef 
al. 2014). Si possono poi valutare i risultati ottenuti confrontandoli fra loro in 
ottica intralinguistica o interlinguistica. 

Dato il grande potenziale scientifico e pedagogico dei corpora (cfr. Flinz 
2020; Flinz, Katelhón 2019), entrambe le prospettive trovano possibilità appli- 
cative in diversi ambiti scientifici e didattici: perla prassi traduttiva dei traduttori 
professionisti, perla formazione dei futuri traduttori e anche perla didattica del 
tedesco come lingua straniera (DaF - Deutsch als Fremdsprache) in generale”. 
L'uso dei corpora LBC si presta inoltre non solo alla ricerca e all'insegnamento 
del lessico specialistico ma anche all'indagine di fenomeni grammaticali. Illu- 
streremo in seguito alcuni di questi usi. 


2.1. Analisi intralinguistiche 


Il corpus tedesco risulta composto da 1.183.484 token (cfr. Figura 8). Trat- 
tandosi tuttavia diun corpus monitor (Lemnitzer, Zinsmeister 2015: 140), & sog- 
getto aintegrazioni e ampliamenti costanti. 


Corpus LBC Tedesco © 

Corpus LBC Tedesco 
Counts General info Lexicon sizes 
Tokens 1,183,484 Corpus description Document word 66,972 
Words 1,018,253 Language German tag 54 
Paragraphs 10,935 Encoding UTF-8 lemma 47,026 
Documents 763 Compiled 11/12/2019 11:01:29 ico 62,797 

Tagset Description етта Ic O 45,498 

Structures and attributes 

doc 763 v 


Figura 8. Informazioni sul corpus LBC tedesco. 


Ai tempi iniziali del progetto LBC, SketchEngine (<https://www.sketchengine.eu>) 
era a pagamento, pertanto l'Unitá di Ricerca ha optato per la versione ridotta open source 
NoSketchEngine. Successivamente grazie ad un progetto europeo SketchEngine é diventa- 
to gratuito per la comunità scientifica e accademica e rimarrà tale fino al 2022. 

Icorpora vengono lemmatizzati e annotati a livello morfo-sintattico in maniera automatica. 
Icorpora LBC possono venire impiegati anche con altre finalità, che si estendono per esem- 
pio agli studi lessicografici e all'analisi del discorso. 
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Una possibilità di impiego consiste nel generare liste di frequenza per lemma 
(Figura 9) che danno informazioni sulla frequenza dei lemmi registrati nel corpus. 


Word list 
Corpus: Corpus LBC Tedesco 


Total number of items: 10,324 
Total frequency: 963,888 


Page |1 | бо Next > 


Figura 9. Screenshot della lista dei lemmi estratta. 


Da qui si possono per esempio ricavare i sostantivi, i verbi, gli aggettivi più 
frequenti: 

e Sostantivi: Werk (2.183), Zeit (1.864), Bild (1.617), Florenz (1.466), Leben 
(1414), Kunst (1.369), Hand (1.346), Kirche (1.307), Rom (1.150), Haus 
(1.145), Papst (1.131), Herr (1.120) ecc. 

e Verbi: sein (28.572), haben (10.113), werden (7.985), sehen (3.131), können 
(3.050), sagen (2.617), lassen (2.273), wollen (2.205), machen (1.859), geben 


1 Abbiamo notato che per sein si trovano sia le occorrenze dell’ausiliare sein sia quelle dell'ag- 
gettivo possessivo sein, il che puö essere dovuto a errori nel tagging automatico. Questo pro- 
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(1.808), kommen (1.800), sollen (1.714), malen (1.677), gehen (1.677), finden 
(1.373), stehen (1.307), arbeiten (1.274), müssen (1.260) ecc. 

e Aggettivi: andere (3.558), groß (3.321), viele (2.852), schön (2.424), gut 
(2.213), alt (1.234) ecc. 


Restringendo il campo di osservazione per esempio ai soli sostantivi, si nota 
subito che a ricorrere piü di frequente sono termini tecnici dell’arte come Werk, 
Bild, Kunst е Kirche, е anche nomi di città come Florenz е Rom. Fra i verbi, come 
prevedibile, ricorrono più frequentemente gli ausiliari e i modali, ma anche verbi 
tipici del linguaggio tecnico, come per esempio malen. Questo uso puó incentivare 
lo sviluppo di una sensibilità per le collocazioni'*, aspetto di una lingua straniera 
assai difficile e quindi soggettoa errori (su questo punto cfr. ancheil paragrafo 2.2). 

Si possono anche effettuare ricerche sull'uso di una parola nel linguaggio 
tecnico e nella lingua standard, come pure sul suo sviluppo diacronico, specifi- 
cando nel campo di ricerca rispettivamente tipologia testuale, autore ed epoca 
storica (Figura 10). 

Oltre alle liste di parole, nel corpus si possono ricercare anche parole isola- 

te. Poiché Kirche é una parola con un'alta frequenza, é interessante riflettere sui 
suoi composti. Con l'opzione di ricerca *kirche possono venir estrapolati tutti i 
composti della parola: 
Peterskirche (51), Hauptkirche (18), Servitenkirche (14), Domkirche (9), Paulskir- 
che (7), Taufkirche (5), Andreaskirche (3), Weltkirche (3), Bettelordenskirche (2), 
Bischofskirche (2), Familienkirche (2), Franziskanerkirche (2), Kathedralkirche 
(2), Klosterkirche (2), Porkirche (2), Vorgángerkirche (2), Augustinerkirche (1), 
Barfüßerkirche (1), Benediktinerkirche (1), Dorfkirche (1), Franziskaner-Kirche 
(1), Gesetzeskirche (1), Gewölbekirche (1), Hauptporkirche (1), Hauskirche (1), 
Kapuzinerkirche (1), Karmeliterkirche (1), Kartheuserkirche (1), Kollegialkirche 
(1), Kuppelkirche (1), Madonnenkirche (1), Marienkirche (1), Markuskirche (1), 
Ordenskirche (1), Pfarrkirche (1), Unterkirche (1). 


A lezione é possibile riflettere sia sul contenuto (il significato dei composti) 
sia sulla forma dei composti (grafia con o senza elementi di raccordo), integran- 
dolericerche eventualmente con dati estratti da altri corpora online. Ció é pos- 
sibile anche con apprendenti di livello linguistico diverso. 


blema, tuttavia, puó anche rivelarsi una risorsa a lezione, laddove si solleciti la sensibilità 
degli apprendenti verso la polifunzionalità di alcuni lessemi. 

La lemmatizzazione automatica di alcune parole (anders, viel ecc.) avviene erroneamente 
con il femminile. 

Il termine «collocazione» trova varie definizioni in letteratura: una empirica (fra gli altri, 
Firth 1957; Evert 2009; Belica, Perkuhn 2015), il cui criterio principale la frequenza, e una 
teorica (fra gli altri, Hausmann 1984, Burger 2015), che definisce le collocazioni come unità 
lessicali in relazione sintattica (Hausmann 1984) o come unità lessicali con un significato 
unitario. La tesi sostenuta in questo contributo é che nel DaF entrambele definizioni possano 
trovare applicazione. La scelta verrà determinata dagli obiettivi dell'unità di apprendimento. 
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Subcorpus: | None (whole corpus) ~ | info create new © 


LINGUA ORIGINALE 


Francese (Francia) 
Inglese (Regno Unito) 
Italiano 

Tedesco (Germania) 
Select All 


LINGUA DI TRADUZIONE 
Tedesco (Germania) 
Select All 


CATEGORIA E SOTTOCATEGORIA 
Divulgativo 

Letterario 

Tecnico 

Select All 


BEE 


AUTORE 


FRAMMENTO 


ANNO DI REDAZIONE 


Figura10. Screenshot del campo di ricerca. 


Le concordanze* della parola Kirche possono inoltre fornire anche informa- 


zioni sul suo uso, come per esempio: 


16 
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in combinazione con aggettivi in funzione attributiva: achteckige Kirche, alte 
Kirche, bischöfliche Kirche, christliche Kirche, große Kirche, kleine Kirche, neue 
Kirche, römische Kirche, schöne Kirche, untere Kirche; 

in combinazione con altri sostantivi: Bild der Kirche, Bronzetür der Kirche, 
Chor der Kirche, Dach der Kirche, Eingang der Kirche, Fassade der Kirche, Grun- 
driss der Kirche, Hauptaltar der Kirche, Hauptkapelle der Kirche, Haupttür der 
Kirche, Kapelle der Kirche, Kreuz der Kirche, Mittelschiff der Kirche, Querschiff 
der Kirche, Schiff der Kirche, Teil der Kirche, Tür der Kirche, Vorderwand der 
Kirche, Wand der Kirche, ecc.; 

in combinazione con preposizioni: in der Kirche, inmitten der Kirche, innerhalb 
der Kirche, nach der Kirche, neben der Kirche, unterhalb der Kirche, von der Kir- 
che, vor der Kirche, für die Kirche, in die Kirche, ecc.; 

in combinazione con verbi (filtro a destra): eine Kirche bauen, eine Kirche ma- 
len, eine Kirche vollenden, eine Kirche verfertigen, ecc.; 


I KWICs possono venir ordinati tramite l’opzione sort Left, sort Right ecc.. Questa op- 
zione offre la possibilità di richiamare l’attenzione su determinate caratteristiche della 
lingua analizzata. 
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e come nome proprio: Kirche del Carmine, Kirche della Pace, Kirche der Annun- 
ziata, Kirche der Madonna, Kirche des Heiligen Andreas, Kirche des S. Agosti- 
no, Kirche Ognissanti, Kirche San Giovanni, Kirche St. Andrea, Kirche von S. 
Agostino, ecc. 


In questo modo é possibile favorire negli apprendenti del tedesco sia una 
maggiore consapevolezza delle collocazioni di una determinata parola sia una 
maggior sensibilità per determinati fenomeni grammaticali. 


2.2 Analisi interlinguistiche 


I corpora compresi nella piattaforma LBC hanno tutti più di un milione di 
token (Tabella 2): 


Tabella 2. Numero dei token per lingua. 


Tedesco Inglese Italiano Francese Russo Spagnolo 


Token 1.183.484 1.784.990 1.647.595 3.818.747 1.647.595 1.162.849 


Per ogni corpus sono presenti informazioni diverse, cosi da poter ricavare, 
fra l’altro, il numero dei rispettivi testi per anno di pubblicazione, autore, gene- 
re testuale (Figura 11): 


doc.printingYear document frequency 


1966 162 
1973 125 
1970 66 
1971 10 
1550 2 
1910 1 


Figura 11. Distribuzione dei documenti nel corpus italiano in base all’anno di 
pubblicazione. 


Il sistema permette anche di costruire subcorpora sulla base della tipologia 
testuale, cosi da poter anche effettuare studi interlinguistici orientati su que- 
sto aspetto. 

Possono venir utilizzate per confronti interlinguistici anche le liste di fre- 
quenza estratte dai corpora, che possono essere utili per l’identificazione di 
possibili equivalenti (cfr. Tabella 3): 

Dalla Tabella 3 ё possibile infatti identificare i seguenti equivalenti: cosa/ 
Ding, opera/Werk, mano/Hand, tempo/Zeit, figura/Figur, anno/Jahr ecc. П si- 
gnificato dei lessemi rimanenti, per esempio ‚Papst‘, puö poi venire eventual- 
mente desunto tramite contesto (Figura 12): 

La parola cercata Papst pud tuttavia venir aperta anche in un'altra finestra 
al di fuori della rappresentazione KWIC, per esempio come testo (Figura 13): 


69 


SABRINA BALLESTRACCI, CLAUDIA BUFFAGNI, CAROLINA FLINZ 


Tabella 3. Liste di parole basate sulla frequenza (frequenza assoluta): sostantivi nel corpus 


tedesco e in quello italiano. 


Sostantivi (D) <-> 


Sostantivi (I) 


Werk (2.183) 
Zeit (1.864) 
Bild (1.617) 
Florenz (1.466) 
Leben (1.414) 
Kunst (1.369) 
Hand (1.346) 
Kirche (1.307) 


cosa (4671) 
opera (3.615) 
mano (2.143) 
tempo (2.093) 
figura (1.731) 
modo (1.693) 
anno (1.693) 
uomo (1.510) 


Jahr (1.276) 

Rom (1.150) 
Haus (1.145) 
Papst (1.131) 
Herr (1.120) 


parte (1.510) 
città (1.462) 
disegno (1.414) 
luogo (1.377) 
parere (1.319) 


Tag (1.118) Roma (1.309) 
Stadt (1.096) storia (1.304) 
Meister (972) tavola (1.284) 
Figur (945) chiesa (1.278) 
Mann (913) messer (1.216) 
Künstler (903) maniera (1.206) 
Ding (899) casa (1.194) 


Query Papst 1,131 (955.65 per million) €) 


Page 1 of 57 | Go | Next | Last 
it_TEC_art_Vas_VitGiu_GadGad_1568r_1966p_de-DE_1849t_2008p 
it_TEC_art_Vas_VitGiu_GadGad_1568r_1966p_de-DE_1849t_2008p 
it TEC art Vas VitGiu GadGad 1568r 1966p de-DE 1849t 2008p 
it TEC art Vas VitGiu AgAg 1568r 1966p de-DE 1849t 2008p 
it TEC art Vas VitGiu AgAg 1568r 1966p de-DE 1849t 2008p 
it TEC art Vas VitGiu AgAg 1568r 1966p de-DE 1849t 2008p 
it TEC art Vas VitGiu AndPis 1568r 1966p de-DE 1849t 2008p 
it TEC art Vas VitGiu AndPis 1568r 1966p de-DE 1849t 2008p 
it TEC агі Vas VitGiu AndPis 1568r 1966p de-DE 1849t 2008р 
it TEC art Vas VitGiu AndTaf 1568r 1966p de-DE 1849t 2008p 
it TEC art Vas VitGiu Агпіар 1568r 1966p de-DE 1849t 2008p 
it TEC art Vas VitGiu ArnLap 1568r 1966p de-DE 1849t 2008p 
it TEC art Vas VitGiu ArnLap 1568r 1966p de-DE 1849t 2008p 


it TEC art Vas VitGiu ArnLap 1568r 1966p de-DE 1849t 2008p 


Maria Novella mit allem Zubehör vom Legaten des Papstes und vom Bischof der Stadt geschenkt wurde, 
» und der Kardinal Latino deglOrsini vom Papst Nicola ll. als Legat nach Florenz geschickt, 
errichtete. Im Jahre 1420 gab ihr Papst Martin V. die Weihe, wie man aus einer 
Legaten jene Stadt freiwillig der Kirche; der Papst versprach dagegen den Hof nach Bologna zu 
erkannten gar bald, wie die Versprechungen des Papstes nichtig waren, und verwüsteten und zerstörten 
aus, Doktor der Rechte und Sekretär von Papst Klemens VI., und verfertigte in der nämlichen 
diesem Bau, und weil die Florentiner sich dem Papst Bonifatius VIII. angenehm machen wollten, 
ans Werk, und rastete nicht, bis er die Figur des Papstes und einen San Pietro und San Paolo beendet hatte 
Scheraggio zerstören, erhielt aber dazu vom Papste keine Erlaubnis. Unterdessen wurde er, wie 
Streiche spielte, und dem er das Bildnis Papsts Cölestin IV, eines Mailänders, und das 
. Der Turm von San Marco wurde 1154 unter den Päpsten Anastasius IV. und Hadrian IV. vollendet; 
in Ehren stand, weil sie viele Jahre zuvor von Papst Pelagius eingeweiht worden, und der Bauart 
» die an San Giovanni in Laterano in Rom unter den Päpsten Lucius Ш. und Urban Ill, (welcher den Kaiser 
man noch sehen kann; weil sie aber von spátern Päpsten zerstört wurden, namentlich von Nicolaus V, 
it_TEC_art_Vas_VitGiu_ArnLap_1568r_1966p_de-DE_1849t_2008p der Conti, der diesen Namen erhielt, weil der Papst aus der Familie der Conti stammte. In dem Jahr, 
it_TEC_art_Vas_VitGiu_ArnLap_1568r_1966p_de-DE_1849t_2008p . </p><p> Man sagt Marchionne habe in Rom für denselben Papst Innozenz Ill. in Borgo vecchio das alte 
it_TEC_art_Vas_VitGiu_ArnLap_1568r_1966p_de-DE_1849t_2008p bis auf unsere Zeit stand die alte Kirche, als Papst Paul IIl., aus dem Haus Farnese, sie nach 
it_TEC_art_Vas_VitGiu_ArnLap_1568r_1966p_de-DE_1849t_2008p ist. Dort stellte er nach der Natur Papst Honorius Ill. dar, dessen Grabmal er auch 
Franziskus gegründet, den der oben genannte Papst Innozenz Ill. im Jahre 1206 bestätigte. 


it_TEC_art_Vas_VitGiu_ArnLap_1568r_1966p_de-DE_1849t_2008p 
it_TEC_art_Vas_VitGiu_ArnLap_1568r_1966p_de-DE_1849t_2008p kann, wie sehr dieses Werk des Meister Jacob von Päpsten , Kardinälen, Prinzen und andern vornehmen 


Page [1 of 57 [бо | Next | Last 


Figura 12. KWICs della parola cercata, Papst‘. 
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Un altro uso particolarmente rilevante per la didattica DaF e il confronto 
interlinguistico delle collocazioni. Prendendo sempre a esempio Kirche e in 
questo caso la traduzione italiana (chiesa)", possiamo riflettere prima sulle 
possibili collocazioni delle due parole (per esempio partendo daltipo AGGET- 
TIVO + SOSTANTIVO) e poi indviduare possibili relazioni di equivalenza 
(Figura 14): 

e Kirche: genannte Kirche, bischöfliche Kirche, alte Kirche, christliche Kirche, un- 
tere Kirche, rómische Kirche ecc. 

e Chiesa: detta Chiesa, nuova chiesa’, chiesa principale, chiesa vecchia, chiesa 
romana, chiesa piccola ecc. 


Figura 13. Frammento di testo perla parola cercata ‚Papst‘. 


( bischáfliche Fr Nj 


\/ 


principale 
| re) 
christliche } Kirche = alte 
= \\ 


nuova 
Figura 14. Rapporti di equivalenza fra le collocazioni aggettivali (Kirche/chiesa). 


I singoli raggruppamenti possono venir considerati anche nei loro contesti 
e confrontati fra loro (Figura 15): 


Q 1,429 > Pe filter. ding KWIC) vecchia 6 (5.10 per million) €) Query Kirche 1,307 > Positive filter (excluding KWIC) alten 13 (10.98 per million) © 
doc#B dorthin kommen, und er arbeitete in der alten Kirche San Domenico, welche den Prädikanten-Mönchen 
Cd LE TALL ELLA LÁ docti Katharina darin darstellte. In der alten Kirche S. Domenico malte er auf einer Wand, wiederum in 
doc#11 Vigna, dove stanno Frati del Zoccolo, nella chiesa vecchia era in un quadro un Cristo morto, tanto doc#17 verzierte er in Fresko eine Kapelle in der alten Kirche S. Spirito derselben Stadt, welche beim Brand 
docf187 quali andarono per terra quando fu rovinata la chiesa vecchio di San Piero per rifar la nuova. </p><p> Fu eee е азаннан ын ЫЫ atta 
doc#202 1 il quale, andato a Perugia, fece nella chiesa vecchia di S. Domenico de" Frati Predicatori em as a rat rg ATT 
docf228 ; il quale per lo interesso che egli aveva nella chiesa vecchia «ché la capella e l' altare maggiore era dock65 = Frati del Zoccolo wohnen, sah man in der alten Kirche einen toten Christus aufs Herrchste von 
doc#322 deputati, ordinorono che si facesse in mezzo la chiesa vecchia una cappella da Antonio da Sangallo, doc#114 fügte hinzu: man müsse es nicht nach der alten Kirche von St. Peter bringen, жама ur mr dafir 
doc#177 уоп Antonio da Sangallo in der Mitte der alten Kirche eine Kapelle zum Teil aus Trümmern [spoglie] 
doc#191 und zu Ravenna der Marmor aus drei alten Kirchen (S. Severo, S. Apollinare in Classe und байа 
doc#193 blieb beharrlich, warf die Hälfte der alten Kirche nieder und legte die Fundamente der neuen (18. 


doc#536 diesen kühnen Gedanken vortegte. Von der alten Kirche , welche der Kaiser Konstantin auf diesem Fleck 
doc#536 Hinter grunde oder der Tribune, wo aus der alten Kirche Konstantins, noch das größte Heiligthum, 
doc#750 Il. machte reine Bahn durch Abbruch der alten Kirche . Mit den größten Mitteln sollte der schönste 


Figura 15. Collocazioni: chiesa vecchia e alte Kirche. 


17 È stato scelto a titolo esemplificativo il parametro range (-1 to 1). L'opzione (-5 to 5) è impo- 


stata per default. 


! Sono state elencate solo le combinazioni più frequenti. Combinazioni come chiesa nuova е 


principale chiesa compaiono anch'esse nel corpus, presentano tuttavia una bassa frequenza. 
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Come mostrano gli esempi sopra riportati, con l’aiuto degli strumenti mes- 
si a disposizione dalla piattaforma LBC gli apprendenti possono fare ricerche 
all'interno dei vari corpora sviluppando la corpus literacy (Mukherjee 2002: 
179-180) necessaria per diventare sempre più autonomi. 


3. Conclusioni e sviluppi futuri 


In questo contributo si sono descritte le caratteristiche più importanti del 
corpus LBC tedesco unitamente ad alcune delle sue possibilità d'impiego. Tale 
descrizione, illustrando il corpus tedesco con determinate proprietà in un dato 
momento, vuole essere l'istantanea di un work in progress. Il corpus necessita 
infatti di ampliamenti testuali continui, qualitativamente elevati, che costitui- 
scano un valido modello linguistico per tutti i gruppi di utenti a cui esso si ri- 
volge: tutte le tipologie testuali presenti verranno arricchite di nuovi esemplari 
testuali, cui andranno ad aggiungersi altre tipologie testuali; si dovrà spostare 
l'attenzione su altre epoche storiche di riferimento (non solo i Beni culturali 
del Rinascimento, ma anche movimenti artistici successivi) e dal punto di vi- 
sta diatopico si dovranno prendere in considerazione altri territori italiani oltre 
alla Toscana. Anche il lavoro scientifico e lessicografico é in progress, tanto che 
vecchie e nuove fasi del processo lessicografico vengono a sovrapporsi, come é 
tipico delle risorse online (Klosa 2016: 29). 

Nonostante il carattere in fieri del lavoro i dati fin qui esposti dimostrano che 
già allo stato attuale il corpus tedesco — come gli altri corpora LBC - puó venir 
utilizzato per numerosi scopi di ricerca e anche per attività didattiche. Come 
illustrato nel paragrafo 1, sono stati impiegati generi e tipologie testuali molto 
diversi in ottica sia sincronica che diacronica. Questa configurazione offre agli 
utenti — che si tratti di esperti o di dilettanti – una vasta gamma di applicazio- 
ni (cfr. paragrafo 3), come pure riflessioni sulle possibilità traduttive. In sintesi, 
il corpus tedesco si presta all'analisi di svariati fenomeni lessicali, morfologici, 
sintattici, morfosintattici e stilistici da prospettive diverse come per esempio: 

• inuna prospettiva orientata alla tipologia testuale; 
e in prospettiva intralinguistica e interlinguistica; 
e in prospettiva traduttiva (cfr. fra l’altro il focus sulla preponderanza di ita- 

lianismi nelle traduzioni raccolte, Farina, Billero 2018); 

e іп prospettiva contrastiva (italiano-tedesco/tedesco-italiano); 
• in prospettiva diacronica e sincronica. 


Speriamo in generale con il nostro corpus di aver messo a disposizione di 
tutti gli interessati che fanno ricerca e lavorano nel campo dei Beni culturali un 
valido strumento dal quale poter ricavare utili indicazioni sulle proprietà lingui- 
stiche delle tipologie testuali inerenti all’arte e alla cultura. A questo proposito 
il corpus tedesco di LBC è già stato impiegato in concreto come fonte primaria 
perl’elaborazione dellemmario provvisorio del progettato dizionario LBC (cfr. 
Farina, Flinz 2020) e per la selezione delle concordanze (cfr. Buffagni, Flinz, 
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Ballestracci 2020) che fotografano l'attuale stato dell'arte dell’unita di ricerca 
LBC per il tedesco. 
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Abstract (Italiano): In questo contributo illustriamo le caratteristiche principali ed alcuni 
esempi di applicazione del Corpus LBC francese, creato nell'ambito del progetto Lessico 
multilingue dei Beni Culturali (LBC). In primo luogo, presentiamo i generi testuali, gli autori 
ele opere presenti nel corpus, descriviamoi criteri di selezione adottati per la loro scelta. 
Successivamente ci soffermiamo sui possibili usi del corpus, mettendo in evidenza come 
esso si presti ad analisi linguistiche. Chiudiamo il lavoro proponendo una valutazione 
dell'attuale configurazione del corpus con uno sguardo sulle prospettive di sviluppo futuro. 


Parole chiave: linguistica dei corpora, lessico, terminologia, arte, beni culturali. 


Abstract (English): This essay describes the main features and possible applications of 
the French LBC corpus, which has been compiled in the framework of Lessico multilingue 
dei Beni Culturali (LBC). First, the authors illustrate the main features of the corpus, with 
a special attention to the selected text genres and authors and selection criteria. Various 
possible linguistic uses of the corpus illustrating some options of the software are then 
presented. An evaluation of the current corpus configuration and outlook conclude the work. 


Keywords: Corpus Linguistics, Lexicon, Terminology, Art, Cultural Heritage. 


Introduzione 


Comeégiàstato accennato nella presentazione generale di questo volume e nelle 
presentazioni dei corpora delle altre lingue, il corpus LBC francese è stato concepi- 
to nell'ambito del progetto interuniversitario Lessico dei Beni Culturali con l'obiet- 
tivo di creare dizionari monolingue e bilingue collegati tra loro da collegamenti 
ipertestuali. Questi dizionari, come i corpora che li alimentano, includono diverse 
lingue: francese, inglese, italiano, spagnolo, russo, tedesco. Nascono per consenti- 
re sia aun pubblico specializzato che a un pubblico più ampio di svolgere ricerche, 
qualitative e quantitative, sul patrimonio artistico delle città di Firenze e della To- 
scana e, in una seconda fase, del patrimonio artistico italiano. I nostri strumenti — in 
particolarei corpora - si rivolgono infatti ad autori di guide o a curatori di mostre, 
commentatori o traduttori, al fine di offrire un supporto nelle loro scelte linguisti- 
che. Il corpus consente infatti di accedere facilmente a una banca dati che puó for- 
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nire informazioni affidabili come, ad esempio, equivalenti affidabili di determinati 
concetti, in particolare quelli relativi a tecniche e materiali artistici, o fornire loro 
informazioni sulla frequenza di determinate collocazioni o co-occorrenze speciali. 

Perilcorpus francese abbiamo raccolto, secondo gli stessi criteri delle altre lin- 
gue, un certo numero di documenti caratterizzati da una certa variazione tipologi- 
ca, e redatti in un arco temporale esteso, dai celebri scritti sul Rinascimento fino a 
tempi moderni e contemporanei. Ció dovrebbe facilitare, tra le altre cose, gli studi 
di semantica comparativa inter e intralinguistica sia in diacronia che in sincronia. 

Il gruppo francese é stato in un certo senso un pioniere nello sviluppo del 
progetto, beneficiando dall'inizio di molte risorse, grazie al contributo di mol- 
ti ricercatori e studenti-tirocinanti, che hanno collaborato a questo progetto sin 
dal 2013. Questo corpus - che deriva da un approccio «corpus-driven» e non 
«corpus-based» (Biber 2012) - ha infatti rappresentato un banco di prova per 
il progetto, che é servito da base di lavoro per le altre lingue, consentendo di evi- 
denziarele difficoltà di gestione delle fonti e di creazione dei metadati. Incorpora 
alcuni elementi destinati a testare diversi aspetti (principalmente la validità delle 
nostre categorie lessicografiche), che vorremmo sviluppare nei prossimi anni per 
tutti inostri corpora. Il corpus francese contiene quindi campioni di testi diversi 
da quelli trovati in altre lingue, sia in termini di tipologia testuale (dizionari, cor- 
rispondenza di artisti, ad esempio, ma anche siti web destinati ai turisti) che dal 
punto di vista dell'estensione del nostro principale oggetto – che ha finora gui- 
dato le nostre scelte - dal momento che abbiamo iniziato ad incorporare il patri- 
monio artistico italiano tangibile e intangibile nel patrimonio artistico toscano. 

Concepito come un laboratorio didattico (Farina 2016), il progetto ha dato vi- 
ta a numerose tesi di laurea e stage per studenti. In questo quadro sono stati creati 
dei subcorpora che sono stati riuniti nel corpus principale o che saranno incorpo- 
rati nei prossimi mesi e anni”. Allo stesso modo, i ricercatori che fanno parte del 
gruppo hanno lavorato su alcuni autori o temi legati al nostro progetto e per farlo 
hanno trascritto un certo numero di testi di cui il nostro corpus ha potuto bene- 
ficiare. Possiamo citare ad esempio il lavoro di Rosa Cetro (Università di Pisa) su 
A. Félibien, quello di Nicole Maroger (Università di Firenze) sul Palio di Siena, il 
progetto di ricerca attualmente sviluppato da Valeria Zotti (Università di Bologna) 
sui racconti dei viaggiatori francesi e francofoni a Bologna e quello di Dominique 
Garand (Università del Quebec a Montreal) che sta attualmente collaborando al 
progetto di raccolta di testi sull Italia di autori quebecchesi. Quanto alle autrici di 
questo contributo, hanno raccolto e trascritto la maggior parte del materiale pre- 
sente oggi nel corpus, passando mano mano in rassegna autori di tutte le epoche?. 


Molti studenti di Valeria Zotti e Annick Farina hanno lavorato ad esempio alle traduzioni di Vasari 
in francese. Una studentessa seguita da Annick Farina peril francese e Sabrina Ballestracci peril te- 
desco harecentemente lavorato al confronto delle traduzioni della corrispondenza di Michelangelo 
in queste due lingue; le sue trascrizioni saranno presto incorporate. Abbiamo anche diretto diverse 
tesi sui testi dei viaggiatori francesi sia a Firenze (A. Farina) che a Bologna (V. Zotti). 

Questi risultati sono serviti come base per la redazione di un libro su Firenze e le sue parole 
chiave attraverso gli autori che l'hanno descritta (Farina 2019). 
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Il nostro lavoro deve molto anche alle collaborazioni interuniversitarie 
franco-italiane come quelle con il Laboratoire d’Informatique dell’Universitä di 
Tours, il Laboratoire UMR 5206 Triangle del CNRS, ilgruppo LiCoRN dell’U- 
niversitä della Bretagna-Sud, che hanno guidato la nostra metodologia sia per 
la costituzione del corpus che per i suoi futuri usi lessicografici. 


1. Contenuto del corpus 


La ricerca delle fonti é stata effettuata dapprima sulla base di bibliografie esi- 
stenti su diari di viaggio in Italia e opere di riferimento, relative alla storia dell'arte 
italiana e del Rinascimento in particolare. I primi testi integrati nel database erano 
classici di pubblico dominio efacilmente accessibili online. In particolare, abbiamo 
tratto una parte sostanziale del nostro corpus dalle risorse disponibili dalla biblio- 
teca digitale Gallica: ad esempio, la traduzione di C. Weiss delle Vite di Vasari pub- 
blicata nel 1900, elabiblioteca digitale archive.org, ad esempio l'opera Des principes 
de l'architecture, de la sculpture, de la peinture... di A. Félibien (1676), entrambi anco- 
ra in fase di trascrizione in fascicoli di edizione*. Abbiamo anche utilizzato opere 
presenti su Wikisource, che spesso abbiamo contribuito a trascrivere online, come 
ad esempio La villa Palmieri (1843) o Une Année à Florence (1841) di A. Dumas. 

Questo spiega perché il nostro corpus & principalmente letterario (quasi 
il 6096 del corpus). Contiene infatti sia i racconti di viaggio degli scrittori del 
Grand Tour e quelli che seguirono leloro orme piü tardi fino all'inizio del XX 
secolo, sia opere di narrativa con Firenze o l’Italia come ambientazione, nonché 
scritti critici o amatoriali sull'arte o sulla cultura italiana. Sappiamo che una 
delle mete privilegiate di questi autori, soprattutto duranteil periodo romantico, 
era la città di Firenze ela Toscana, cosa non sempre vera per i viaggiatori euro- 
pei che spesso preferivano a loro Roma, Venezia o Napoli. Non c'é da stupirsi, 
quindi, sela maggior parte dei nostri testi sono tratti dalla letteratura di viaggio 
del XIX e della prima metà del XX secolo. Le numerose traduzioni che compa- 
iono nel nostro corpus, anch'esse redatte nello stesso periodo, confermano il 
particolare interesse degli studiosi francesi per il patrimonio artistico italiano. 

Tale interesse prefigura l’attuale predilezione per il turismo culturale in Italia. 
Anche se questo rappresenta, per il momento, una porzione minore del nostro 
corpus, testi più recenti e più contemporanei sono stati incorporati con il progre- 
dire della ricerca, in quanto il viaggio in Italia resta un tema molto vivo nella let- 
teratura francese e francofona. Ha suscitato nel tempo e suscita tuttora numerose 
pubblicazioni che spaziano dai libri di cucina alle guide turistiche, dalle recen- 
sioni d'arte ai dizionari di pittori, passando dalla corrispondenza e dagli articoli 


4 


Citiamo in particolare la Bibliographie italico-frangaise... (1886), la bibliografia del Grand Tour 
disponibile sul sito della Biblioteca Nazionale di Firenze, quella del sito del Centre de Recherche 
sur la littérature des voyages, il dossier tematico sui viaggi in Italia del sito Gallica della Biblioteca 
Nazionale di Francia e Castiglione Minischetti, Dotoli, Musnik (2002). 


79 


ANNICK FARINA 


di giornale. Di seguito é riportato il dettaglio degli autori che compaiono nel no- 
stro corpus con l'indicazione dei token‘, in ordine decrescente. 


Tabella 1. Numero di tokens per ciascun autore presente nel corpus in ordine decrecente. 


Viollet Le Duc 853.133  Lafenestre, Georges 24.527 Revel, Adele 4.588 
Fernandez, Dominique 726.437  Perrot, George 20.886 Pommier, Édouard 4.443 
SA6 264.073 Allais, Gustave 19.221 Schmitz, Isabelle 4.010 
Vasari, Giorgio 252.132 Goncourt, J. et E. 19.194 Dufay, Henri 3.832 
Stendhal 218.313  Félibien, André 18.894 Grimaldi, Edouard-F. 3.594 
Dumas, Alexandre 168.272  Brosses, Charles de 18.316 Musset, Paul de 3.584 
Colet, Louise 135.166 Michel, Émile 17.289 Jaucourt, Chevalier de 3.548 
France, Anatole 103.614 Gautier, Théophile 15.326 Bard, Joseph 3.266 
Faure, Élie 84.716  LaSizeranne,R.de 15.195 Pasquin, Antoine-C. 3.028 
Lang, Jack 73.914 Renan, Ernest 14.695 Powell, Véronique G. 2.612 
Bazin, René 73.301 Le Routard 14.463 Favre le Bret, Robert 2.556 
Taine, Hippolyte 58.962 Montaigne, 13.057 Erdan, Andrea 2.470 
Michel de 
Auzias, Dominique 55.897  Fréville, Valentin 12.120 Taillasson, Jean-J. 2.106 
Cellini, Benvenuto 50.742 Lescure, O. 11.584 Nobecourt, Jacques 1.947 
Grandgeorge, Gaston 48.737  Palustre, Léon 10.414 Prieur, Jean 1.909 
Klaczko, Julian 44.386 Giono, Jean 10.135 Bertheroy, Jean 1.809 
Feuillet, Michel 42.624 Méry, Joseph 9.976 Mallarme, Camille 1.593 
Meyer, Eric 40.029  Staël-Holstein, G. 9.152 Colombari, Colonel F. 1.578 
Moran, Robert 34.705 Libri, Guglielmo 8.790 Creuzé de Lesser, A. 1.564 
Maurel, André 32.942 Delacroix, Eugène 7.174 Beaugrand, Honoré 1.410 
Rosov, Gricha 32.613  Wyzewa, 5.299 Dela Borie, G. 1.155 
Théodore de 

De Navenne, Ferdinand 30.664 Mallet, George 5.137 Gaboury, Louise 907 
Chateaubriand, 29.599 Camus, Albert 5.033 Artusi, Pellegrino 388 
Frangois-R. 


° In SketchEngine, il software utilizzato per il nostro corpus, i dati statistici sono forniti in nu- 
mero di “token” e/o “parole”, a seconda dei tipi di ricerca. Un “token” è definito come «the 
smallest unit that a corpus consists of. A token normally refers to: a word form: going, trees, 
Mary, twenty-five... / punctuation: comma, dot, question mark, quotes.../ digit: 50,000... / 
abbreviations, product names: 3M, 1600, XP, FB...anything else between spaces / There are 
two types oftokens: words and nonwords. Corpora contain more tokens than words. Spaces are 
nottokens. A text is divided into tokens by a tool called tokenizer which is often specific for each 
language» <https://www.sketchengine.eu/my_keywords/token/> (consultato nov. 2020). 


Senza autore. 


80 


IL CORPUS LBC FRANCESE 


Il corpus francese LBC comprende 3.164.995 parole, corrispondenti a 252 testi 
(libri, articoli o capitoli dilibri) di cui 129 testiin lingua francese originale e 123 testi 
tradotti dall'italiano al francese” che sono essenzialmente frammenti per consentire 
lafutura creazione dibasi parallele, secondo le seguenti proporzioni divise per secolo. 


Tabella 2°. Distribuzione dei tokens per anno/secolo di pubblicazione. 


Secolo Tokens Data di redazione Tokens Percentuale di tokens? 
XVI 13.057 1580 13.057 0,3496 
XVII 18.894 1676 18.894 0,5596 
XVIII 21.864 2 en 0,63% 

1751 3.548 

1801 1.564 

1807 11.258 

1815 5.137 

1817 212.493 

1825 582 

1827 29.599 

1829 2.691 

1830 7.174 
XIX 1.796.410 1832 879 52,17% 

1841 4.953 

1842 3.028 

1843 122.326 

1844 3.594 

1849 14.695 

1850 1.212 

1853 13.808 


7 


Si tratta delle traduzioni delle Vite di Vasari (sono giä state incorporate 65 vite d’artista, 


il lavoro di trascrizione & ancora in corso per le altre vite), di Benvenuto Cellini, La vita di 
Benvenuto Cellini (Libri I e IT), e una ricetta di Pellegrino Artusi. Questi testi rappresentano 
303.262 parole, ossia circa il 1096 del corpus. 


Sono stati presi in considerazione solo testi ‘originali’. Con i testi tradotti si pone il proble- 


ma del momento della stesura del testo originale che non coincide con quello della stesura 
della traduzione e di conseguenza con le caratteristiche linguistiche della lingua utilizzata, 
che varia a seconda delle date. Nella consultazione dei dati é possibile filtrare questi testi sia 
sulla base dell'anno di scrittura dell'originale che dell'anno della sua traduzione. 


Percentuale calcolata sul numero totale di token dei testi non tradotti presenti nel corpus 


(3.443.357). 
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1854 857.977 
1855 19.194 
1862 135.166 
1863 4.588 
1864 58.962 
1865 15.326 
XIX 1.796.410 1806 ач 52,17% 
1867 247 
1870 5.631 
1878 20.886 
1880 44.386 
1888 141 
1892 10.414 
1894 176.915 
1901 17.289 
1903 30.664 
1905 5.299 
1906 18.896 
1907 48.737 
1909 19.221 
1910 15.195 
1913 34.751 
XXe 554.153 1923 84.716 16,09% 
1924 1.593 
1934 1.909 
1936 5.033 
1938 2.556 
1953 10.135 
1969 1.947 
1982 221.507 
1994 34.705 
2002 249.623 
2007 2.612 
XXIe 1.038.979 2008 297.931 30,17% 
2012 113.943 
2013 33.768 
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2015 907 
XXle 1.038.979 2016 321.722 30,17% 
2017 18.473 


Da questa tabella si evince chiaramente che la lingua рїй rappresentata nel 
corpus é la lingua francese del XIX e XXI secolo cui corrisponde una maggiore 
accessibilità. I testi del XIX secolo sono infatti liberi dal diritto d'autore e i testi 
contemporanei facilmente accessibili online. E peró necessario notare che non 
tutte le categorie di testi inseriti nel corpus sono distribuite in modo omogeneo 
sui diversi periodi attestati, come vedremo piü avanti (cfr. Fig. 4), aspetto che 
dovrà essere preso in considerazione durante ricerche specifiche su generi te- 
stuali (vedi parte 2.) 

I testi sono stati suddivisi in quattro categorie o generi: testi di divulgazio- 
ne (DIV); dizionari (DIZ); testi tecnici destinati a specialisti (TEC); testi let- 
terari (LET). 


Tabella 3. Distribuzione dei documentiin base alle categorie (e sottocategorie) del corpus. 


Percentuale sul Sottocategoria Num. Num. Percentuale rela- 
totale parole documenti parole tiva sul totale 
corpus parole corpus 
BLG (blog) 1 27.029 0.8596 
DIV inc RAY, rw е в 41.940 1,32% 
(divulgazione) ы Болар 
GO gule à 277.179 8,75% 
turistiche) 
DIZ А 22,26% MON , 704.622 22,2696 
(dizionario) (monolingue) 
ARC 9 
(architettura) 13 24.290 0,7696 
TEC(tecnico) 8,4296 ART (arti) 67 243.398 7,6596 
GAS qll 321 0,01% 
(enogastronomia) 
BIO (biografie) 124 733.487 23,17% 
LET (letterario) 58,35% FIC (fiction) 10 524.493 16,57% 
SAG (saggi) 17 589.228 18,61% 


1. Lacategoria [DIV] comprendetesti di divulgazione destinati al grande pub- 
blico, tratti principalmente da documenti recenti, come si può vedere nel- 
la Tabella 4). Questi testi sono suddivisi in tre sottocategorie: 1 testo sotto 
forma di blog partecipativo di appassionato di viaggi concepito come una 
nomenclatura [DIV_BLG]; 8 testi (XX e XXI) tratti da riviste specializzate 
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e dalla stampa [DIV_RIV]; 4 guide turistiche di cui 1 del 1829 e le altre po- 

steriori all'anno 2000 [DIV GUI]. 

I dizionari ([DIZ]) comprendono 7 testi di cui 2 del XVIII secolo e 5 del XIX 

secolo (22,26% del corpus generale). Questa categoria è stata creata con l’o- 

biettivo di stabilire una base di lavoro per la costituzione di futuri dizionari 

monolingue specializzati che comprendano definizioni, citazioni e riferi- 
menti di origine. Come si vede, questa categoria é composta quasi esclusi- 
vamente dal Dictionnaire raisonné de l'architecture francaise di Viollet-le-Duc 

(peraltro non riportato integralmente nel nostro database che comprende 5 

volumi su 11). Questo testo fondamentale per la cultura artistica francese, 

che occupa quasi un quarto dei nostri dati, puó apparire sovradimensiona- 
to rispetto ad altri testi raccolti e ad altre lingue che non hanno beneficiato 

di una simile risorsa documentaria. Per questo abbiamo introdotto la pos- 

sibilità di escludere questo sottocorpus dalle ricerche per evitare di falsare 

i risultati. Inoltre, 2 articoli dell'Encyclopédie: sono stati aggiunti l'articolo 

«Florence» e l'articolo «École florentine». 

Alcunitesti destinati ad un pubblico specializzato nello studio delle arti, so- 

no stati classificati come «tecnici» ([TEC]). Tale categoria é composta da 81 

documenti, suddivisi in tre categorie o sottocorpus: testi tecnici specializzati 

in architettura ([TEC_ARC]); testi relativi ad altre tecniche artistiche, co- 
mela scultura o la pittura ([TEC_ART]) ed infine testi riguardanti il campo 
dell’enogastronomia ([TEC_GAS]), specialità che si presume giocherà un 
ruolo importante nella costituzione del patrimonio gastronomico italiano. 

A questo scopo sono state raccolte, tra l’altro, le celebri opere dell’Artusi. 

Testi letterari ([LET]): in questa tipologia sono state classificate opere che 

hanno come ambientazione l’Italia e più in particolare la Toscana e la città 

di Firenze. Si tratta di 151 documenti che costituiscono più della metà del 

nostro corpus. Questa categoria è stata suddivisa in tre sub-corpora: 

a. opere di carattere biografico ([LET_BIO]: 23% del corpus). La maggior 
parte sono costituite dai resoconti di viaggi in Italia dei grandi scrittori 
del XIX secolo: dal Voyage en Italie di Chateaubriand (1827), a L'Italie des 
Voyages di Ernest Renan (1849), passando da Une année à Florence di Du- 
mas (1841). Allo stesso modo, abbiamo integrato la traduzione in france- 
se della vita di Benvenuto Cellini (per il momento, libri I e II, traduzione 
del 1847 di Léopold Leclanché). Abbiamo già preparato la maggior par- 
te delle lettere di Michelangelo (traduzione di Boyer d’Agen risalente al 
1911) ma siamo inattesa di prendere decisioni sulla loro futura classifica- 
zione ein particolare sulla possibilità di integrare frammenti di una stessa 
opera in diverse categorie prima di renderle disponibili nel corpus (cfr. 
Conclusione). Vorremmo, in un prossimo futuro, aggiungere traduzioni 
dei taccuini di Leonardo da Vinci, a partire dal suo Trattato sulla pittura, 
e frammenti delle Istorie fiorentine di Machiavelli. 

b. Opere relative alla narrativa ([LET_FIC]: 16,5% del corpus): gran par- 
te di questo sotto-corpus è costituito da opere del XIX secolo tra cui il 
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famoso racconto di Madame de Staél, Corinne ou l'Italie (1807), in par- 
ticolare Le séjour a Florence, dal libro ХУШ. 

I saggi (ЕТ SAG]: 18,6% del corpus) sono costituiti da 17 testi distri- 
buitiin poco più di due secoli, dal Settecento ai giorni nostri. Questi in- 
cludono, tra gli altri, l'Histoire de la peinture en Italie di Stendhal (1817) e 
alcuni articoli pubblicati nella Revue des deux mondes (1832, 1878, 1901, 
1905, 1906). Abbiamo anche digitalizzato e poi processato mediante OCR 
il Que-sais-je sull’arte italiana (Michel Feuillet, 2008) ma anchei Diction- 
naire amoureux de l'Italie di Dominique Fernandez (1997 e 2008). Que- 
sta sottocategoria ё la più difficile da definire rispetto alle altre perché il 
patto di lettura potrebbe essere cambiato nel corso dei secoli. Un'opera 
che nell’Ottocento, infatti, era destinata a un pubblico di specialisti delle 
arti e delle tecniche artistiche può rivelarsi oggi una testimonianza lette- 
raria lasciata in eredità da illustri critici d’arte dell’epoca. 


Tabella 4. Percentuale di documenti in ciascuna categoria divisi per secolo. 


DIV DIZ TEC LET 
(divulgazione) (dizionario) (tecnico) (letterario) 

XVI 0 0 0 0,9% 
XVII 0 0 80% 0 

хуш 0 28,6% 0 3,6% 
хїх 8,3% 71,4% 13,3% 61,6% 
хх 16,7% 0 6,7% 28,6% 
XXI 75% 0 0 5,3% 


2. Esempi di ricerche all'interno del corpus 


Grazie alla partecipazione attiva al progetto di un informatico che ha otte- 


nuto contratti di ricerca postdottorale (Riccardo Billero), siamo stati in grado 
di sviluppare sia un modello di gestione delle fonti che un modulo di ricerca ad 
hoc all'interno del corpus". Illustreremo qui alcuni esempi di ricerche all'in- 
terno del corpus con diversi filtri e opzioni". 


Nell'ambito diun confronto tra il corpus francese e quello tedesco (Fari- 


na, Flinz 2020), abbiamo intrapreso una ricerca sulle diverse denominazioni 
del monumento principale di Firenze, il Duomo di Santa Maria del Fiore, in 
entrambe le lingue secondo le tipologie di testi e la loro epoca di redazione. 


L'interfaccia di consultazione del corpus è attualmente in italiano ma sarà presto disponibi- 


le nella lingua di ogni corpus. 


Billero 2020). 


Sulla scelta del software NoSketchEngine e sulla gestione dei dati e dei metadati dei no- 
stri corpora, si rimanda agli articoli di Riccardo Billero (Billero, Nicolás Martínez 2017 e 
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Per verificare il numero di occorrenze del nome Sainte-Marie-des-Fleurs ei 
contesti in cui si trova, abbiamo dapprima effettuato la ricerca solo nei te- 
sti “in lingua originale” e nel sottocorpus di testi appartenenti alla catego- 
ria “Letterario” utilizzando ilmodulo diricerca disponibile in “Search/Text 
types” (Figura 1): 


Corpus: | Corpus LBC Francese v 
Simple query: |Seinte-Marie-des-Fleurs Make Concordance 
Query types Context Text types © 


Text types 


Subcorpus: | None (whole corpus) v info create new © 


LINGUA ORIGINALE 


Francese (Canada) 
Francese (Francia) 
Francese (generico) 
C itatiano 


Select All 


LINGUA DI TRADUZIONE 


U Francese (Francia) 
C Francese (generico) 


Select All 


CATEGORIA E SOTTOCATEGORIA 
C Divulgativo 


AUTORE 


TITOLO 


ANNO DI REDAZIONE 


Figura 1. Ricerca di concordanze contenenti Sainte-Marie-des-Fleurs nei testi in lingua 
originale della categoria «Letterario». 


Query Sainte-Marie-des-Fleurs, Letterario, Francese (Canada), Francese \Francia\), Francese \(generico\) 11 (2.88 per million) @ 


1 
2 
3 
4 
6 
7 
в 
9 
o 
1 


n'est pas qu' une réputation . Elle est bel et bien intégrée dans les mœurs . SAINTE-MARIE-DES-FLEURS . Notre premier soin , en arrivant à Florence , avait été de déposer aux palais 
La nouvelle cathédrale commença donc de s'élever , sous la gracieuse invocation de Sainte-Marie-des-Fleurs , nom qu'elle reçut , disent les uns , en souvenir du champ de roses sur lequel 
et sa Tour penchée . Arnolfo di Lapo avait jeté sur la place du Dôme les fondemens de  Sainte-Marie-des-Fleurs ; Sienne avait élevé sa cathédrale au clocher rouge et noir , et y avait renfermé , 
5 élevaient en même temps que le Dôme de Sienne , le Campo-Santo de Pise, et le Dôme de Sainte-Marie-des-Fleurs . Le commencement du Хе siècle avait bien vu naître les Niebelungen , et mourir 
, qui était jour de fête , le cardinal Riario devait entendre la messe dans le Dôme de Sainte-Marie-des-Fleurs , et comme il avait fait prévenir Laurent et Julien de cette solennité , il était 
„en comparaison d" une statue de 1° un ou d' un tableau de L'autre . En sortant de Sainte-Marie-des-Fleurs par la grande porte du milieu , on se trouve juste en face d une autre porte . C'est. 
venait de couronner de sa coupole le monument d' Arnolfo di Lapo . Enfin Sainte-Marie-des-Fleurs était érigée depuis 1420 en église métropolitaine par le pape Martin Y , lorsque 1’ 
d indulgence pour Les créations de L' esprit humain . IL montait en chaire aussi a Sainte-Marie-des-Fleurs , la cathédrale omée du campanile de Giotto . Préches virulents contre la 
Allori . Pour peu que vous vous promeniez , un soft de pleine lune , sur la place de Sainte-Marie-des-Fleurs , à L'endroit où le Dante aimait à se reposer , et que vous regardiez Les jeux de la 
Cellini , et de tous les peintres de l'école dite Florentine | La cathédrale, Sainte-Marie-des-Fleurs , est une immense et hardie création de Brunelleschi ; sa campanille et son 
que Lucca della Robbia et Donatello avaient exécutés pour la tribune de L'orgue, à Sainte-Marie-des-Fleurs . Ces bas-reliefs furent enlevés et déposés , vers la fin du XVlle siècle , à L' 


ODODO 


O00000 


Figura 2. Le undici occorrenze di Sainte-Marie-des-Fleurs nelle fonti letterarie del corpus. 


Questa ricerca, confrontata con quelle dello stesso tipo nelle altre cate- 
gorie testuali, poi con le altre forme (Santa Maria Novella, Dime e Duomo) 
nelle diverse categorie ha permesso di constatare che, mentre il nome fran- 
cese del monumento Sainte-Marie-des-Fleurs non è mai usato nei nostri testi 
divulgativi (nelle guide turistiche) né si trova nei testi in traduzione, appare 
in buona proporzione rispetto ad altri nomi nelle opere letterarie. L'incrocio 
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di questi dati con la datazione delle occorrenze (visualizzazione delle date 
di scrittura ottenute modificando le opzioni come mostrato in Figura 3) ha 
permesso di comprendere meglio la distribuzione della scelta di denomina- 
zione del monumento. 


View options © 
Attributes Structures References. 

word docs | [Token number 5 
O tag <p> Document number 
Biome > doc file 
D word (lowercase) ps en 

Lam reo) Lingua Originale 

Display attributes |Categona e sottocategoria 
© For each token Autore 
© KWIC tokens only Titolo 

[Frammento 


О as tooltips 


[Info anno di redazione 


+ | Anno di pubblicazione M 


Ü References up 


Page size (number of lines): [30 


KWIC context size (number of characters): [70 
(Including positional attributes) 


L Sort good dictionary examples (СЕХ) Ө. 
Ü Show GDEX scores in concordance (slow, use only for GDEX development) 
Number of lines to be sorted: | 150. | 


L Icon for one-click sentence copying. 

L Attow muttipte tines selection 

L Do not use flash for copying to clipboard 
Checkbox for selecting lines 

Show line numbers 

Shorten long references 


Save 8 change options 


Figura 3. Modifica delle opzioni di visualizzazione dei risultati nel menu “View options”: 
qui, “anno di redazione”. 


Query Santa, Maria, del, Fiore, Letterario, Francese \(Canadal), Francese \(Francia\), Francese \(generico\) 34 > Sort doc.writingYear/ 0>0 34 (8.90 per million) €) 


Page |1 of 2{ Go | ех}! Last Concordance is sorted. Jump to: [1815 v | 


11815 de L'autel de la cathédrale appelée autrefois l'église de la Reparata aujourd'hui Santa Maria del fiore , que fut massacré Julien de Médicis: la famille des Pazzi , riche et ancienne , o 
21817 Michel-Ange s engage envers la confrérie de marchands qui se réunissalent à Santa Maria del Fiore , à tirer une statue haute d ‘environ neuf brasses ( cing mètres vingt-deux ü 
31817. Il ébaucha une statue de Saint Matthieu , qui se voit encore dans la premiere cour de Santa Maria del Fiore , et qu’ il abandonna peut-être comme ayant une position trop contournée „Pourne — [] 
41817 Jean Auguto , Anglais de naissance , celui qui fut enterré avec tant de pompe dans Santa Maria del Fiore , la cathédrale de Florence , et sur le tombeau duquel on voit un des premiers grands (О) 
51817 топ ceil a plongé dans la plaine , et j ‘ai aperçu de loin , comme une masse sombre , Santa Maria del Fiore et sa fameuse coupole , chef-d'œuvre de Bruneleschi . C'est là qu'ont vécu le Dante, С) 
61817 les marchands de Florence : ce sont des forteresses . Je regardais tout à L'entour de Santa Maria del Fiore (bâtie en 1293 ) , ces arcades légèrement gothiques , dont la pointe élégante est — [] 
71817 fermé avec un mur les arcades qui entouraient la place immense au milieu de laquelle Santa Maria del Fiore s'élève isolée . Je me sentais heureux de ne connaître personne , et de ne pas o 
81817 auraient L'air de fous s ils se présentaient aujourd'hui au grand café à côté de Santa Maria del Fiore ; mais comparés aux personnages de Paul Veronese et du Tintoret (je choisis exprès C 
91862 mesure que je marche , Florence et ses tours se déploient sous mes yeux ; la coupole de Santa Maria del Fiore , le palais Vecchio et le Bargello dominent les groupes des monuments ; j ‘arrive о 

10 1862 Les clochers de Florence montent en relief les coupoles des églises Santa Croce et Santa Maria del Fiore scintillent au soleil . A ma droite , les parterres du jardin dei Semplici répandent D 

111862 une voix Juste et superbe , un chant à travers lequel Je distingue ces paroles : Bella santa Maria del Fiore Del Toscani sel L'amore | Bellissima torre del Giotto Tu sel la glola del petto | A O 

12 1862 deux des poétes immortels , parrains des fils de la Toscane , Le méme jour , је visite Santa Maria del Fiore , le Baptistére et le Campanile de Giotto . Que dire de ces trois monuments quin 'ait C] 

13 1862 apparaît comme la carène d ' un navire autour d ' un grand mat . Je fais le tour du Dôme ou Santa Maria del Fiore , nom suave que l'église emprunte au nom méme de Florence et à ses armes primitives : C] 

141862 fière Antonio , commentait Dante au quinzième siècle , dans cette église même de Santa María del Fiore , comme il eût fait d un texte sacré . Nos deux amoureux marchent devant moi ;ils — [] 

151862  ,fut consacrée au commencement du quinzième par le pape Eugene IV . Comme celle de Santa Maria del Fiore , la facade est restée inachevée : elle est en plerres brutes . On travaille à une D 

16 1862 elles représentent l Église militante et l'Eglise triomphante . La cathédrale de Santa Maria del Fiore , reproduite dans une de ces fresques , symbolise Г Église militante , entourée de [m] 

171862 que nous approchons , nous voyons poindre au-dessus des toitures la coupole de Santa Maria del fiore de Brunelleschi , puis le campanile de Giotto , puis quelques dómes , quelques O 

18 1864 Pierre, fils de Laurent , institue une discussion sur la véritable amitié dans Santa Maria del Fiore et propose en prix au vainqueur une couronne d ' argent . On voit perles récits de ü 

19 1906 étaient restés aux œuvres de beauté publique , portes du Baptistère , Coupole de Santa Maria del Fiore , etc . Fêtes , vétemens et jeux , gardalent encore un caractère de gravité décente .« [] 

201906 „une grande et belle dame , admiratrice de Savonarole , le décide à |" accompagner à Santa Maria del Fiore . Il s y sent mal à l'aise , entouré @ ceillades défiantes , au milieu d'une multitude — [ ] 

21 1907 et severe , qui regne ici . Les artistes florentins qui ont élevé cette basilique de Santa Maria del Fiore sont des Romains de la trempe de Brutus . D'ailleurs , ce caractère de grandeur о 

22 1907 et des transepts , imprime а l'îme je ne sais quelle horreur sacrée . Cet édifice de Santa Maria del Fiore , presque repoussant au premier aspect , tant il paraît froid et nu, saisit peuäpeu C] 

23 1907 quartiers de la ville en attendant que nous allions te retrouver а neuf heures à Santa Maria del Fiore . C'est è Santa Trinità que nous allons d' abord ; cette belle église gothique que еп [] 

24 1907 de son génie à la chapelle del Pazzi , à la vieille sacristie de Saint-Laurent , à Santa María del Fiore ; Brunelleschi m' apparait comme le Michel-Ange de L'architecture , un O 

25 1913 + les Florentins conseillent de tout recommencer ; Florence construisait alors Santa Maria del Fiore qu ' ils voulaient la plus belle église du monde : celle de Sienne devient menaçante, U] 

26.1913 qui püt indiquer une autre voie ? Florence п. avait pas de modèles , et elle crée Santa Maria del Fiore . Mais il y а mieux . Vienne la Renaissance . L'Italie se couvre de monuments nouveaux. [C] 

27 2002 appartement , la coupole toute proche de Santo Spirito et Le dôme plus lointain de Santa Maria del Fiore ) deux chefs-d'œuvre de Brunelleschi | = Mario grommela que L'individu qui nous [u] 

282002 leur ceinture de chasteté . Le marlage d' Henri IV et de Marie de Médicis fut célébré à Santa Maria del Fiore . Un seleneur de sa cour , accompagné d' une délégation nombreuse , représentaltle — [ ] 

29 2008 le dessin С Amotfo di Cambio , Les Florentins ont construit leur cathédrale , Santa Maria del Fiore ( fiore , qui signifie « fleur » , désigne Le lys rouge emblème de la cité ) . Cependant, DI 

302012 paie le prix réservé à 1' inédit : « Le 14 du mois de mai 1504 on sortit de l' Œuvre de Santa Maria del Fiore le géant de marbre : il fut amené vers minuit , et il fallut casser le mur au-dessus de [] 


раде 1 of2[ Go] Next | Last Concordance is sorted. Jump to: [1815 v] 


Figura 4. Visualizzazione delle occorrenze di Santa Maria del Fiore nella categoria 
“Letterario” del corpus, classificate per data di redazione (classificazione mediante 
Popzione “Sort / References”). 


Infatti, il 90% delle occorrenze di Sainte-Marie-des-Fleurs risalgono al XIX 
secolo e quasi l'8096 di Santa Maria del Fiore sono del XX e XXI secolo. La dif- 
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ferenza di generi testuali ci é sembrata cosi un elemento rilevante per spiegare 
le differenze nella designazione. La designazione in lingua originale italiana si 
manifesta in particolare piü frequentemente nelle guide turistiche, che optano 
per ilmantenimento della forma originale dei nomi propri in generale: tale for- 
ma siritrova anche nei testi in traduzione. Tuttavia, il periodo diredazione dei 
documenti non é meno importante. La datazione delle occorrenze ci permette 
quindi di compensare la mancanza di omogeneità nelle proporzioni date a cia- 
scun periodo storico nelle diverse categorie testuali del nostro corpus, che ab- 

biamo gia illustrato nella parte 1. 

Un'altra opzione estremamente utile per la nostra ricerca lessicografica è 
quella che ci permette di ottenere informazioni su collocazioni e co-occorren- 
ze sulle diverse parole presenti nel corpus. E possibile effettuare questa ricerca 
in due modi diversi: 

a. utilizzando l'opzione “Collocation” si ottiene un elenco delle forme presen- 
tia una distanza da definire nel menu di ricerca. Ad esempio, nella Figura 5, 
vediamo una ricerca delle parole che si trovano a una distanza di una o due 
parole a destra della parola «arc»: 


Collocation candidates © 


Attribute: | word v |In the range from: 0 to: 
Minimum frequency in corpus: 5 
Minimum frequency in given range: 3 
T-score ^ T-score ^ 
MI MI 
MI3 MI3 
log likelinood log likelihood 
min. sensitivity min. sensitivity 
Show functions: |logDice 7 | Sort by: |logDice a 


Make candidate list | Save options | 


Figura 5. Ricerca diunalista di parole a una distanza di 1 о 2 parole a destra dellemma 
arc nel menu “Collocation”. 


Questa ricerca ci permette di ottenere sia collocazioni con struttura «arc + 
aggettivo o sostantivo», sia quelle con struttura ad «arc + preposizione + 
nome»: arc ogive, arcs doubleaux, arc formeret, etc. et arc en ogive, arc en tiers- 
point, arc de voúte, etc. 

b. Facendounaricerca di concordanza su una parola, tramite l'opzione di visua- 
lizzazione "Sort/Left" o “Sort/Right”, possiamo inoltre osservare le diverse 
collocazioni spostandoci tra le diverse pagine dei risultati, come presentato 
in Figura 7 (sempre nell'ambito di una ricerca di collocazioni con la paro- 
la «arc»). 
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Collocation candidates 


T-score MI logDice 


count 

Р | N doubleaux 189 194 13.741 11.026 11.612 
BIN ogives 180 244 13.407 10.624 11.506 
P | N doubleau 129 129 11.352 11.063 11.109 
PIN décharge 60 72 7.741 10.800 10.048 
РІ М ogive 43 101 6.550 9.831 9.545 
BIN tiers-point 34 77 5824 9.884 9.225 
PIN plein 43 615 6.513 7.225 9.198 
P | N triomphe 31 148 5.555 8.808 9.038 
BIN brisé 28 76 5284 9.623 8.946 
PIN cercle 29 236 5364 8.039 8877 
PIN cintre 26 153 5.085 8.506 8.780 
P | N diagonaux 23 38 4.792 10.339 8.692 
PIN brisés 21 43 4,578 10.029 8.557 
P | N voûtes 24 992 4804 5.694 8.146 
PINE 15 449 3.818 6.160 7.782 
P | N formeret 12 72 1454 8.478 7.726 
P |N croisés 10 47 3.155 8.831 7.483 
BIN sont 50 8,815 6.488 3.601 7.272 
PINS 10 710 3.057 4914 7.037 
Р | N au-dessus n 1,159 3.153 4.344 6.936 
PINA 14 1,980 3.494 3.919 6.929 
Р | N bandés 6 36 2.442 8.478 6.755 
PIN étant 9 1,069 2.833 4.171 6.691 
Р | N formerets 6 148 2.421 6.439 6.669 
PINC 15 3,078 3.501 3.382 6.659 
Р | N principaux 6 161 2.418 6.317 6.659 
PIN dont 21 5,097 4.062 3.140 6.643 
P | N principal 6 225 2.406 5.834 6.612 
PIND 8 1,057 2.653 4.018 6.527 
Р | N surbaissés 5 8 2234 10.385 6.514 
PIN voy 7 731. 2516 4357 651 
P | N moulurés 5 14 2.233 9.578 6.509 
PIN AB 5 100 2.215 6.741 6.442 
PINd 91 33,774 7.885 2.527 6.389 
PIN en 95 36,858 7.980 2.463 6.331 
Р | М portant 5 421 2.148 4.668 6.215 
PI N surbaissé 4 8 1.998 10.063 6.192 
PIN ABC 4 18 1.995 8.893 6.184 
PINKL 4 18 1.995 8.893 6.184 
PINAD 4 21 1.995 8.671 6.182 
Р | N indépendants 4 50 1.988 7.419 6.159 
PIN se 38 15,939 4.956 2.351 6.134 
PIN saillants 4 128 1.970 6.063 6.099 
PIN: 47 21,569 5.385 2.221 6.043 
BIN formant 4 270 1.936 4.986 5.995 
PINI 4 304 1.928 4.815 5.972 
PIN nartent 4 205 107R ARI 5 971 


Figura 6. Risultato della ricerca in Figura 5: lista di parole a distanza di 1 o 2 parole 
dal lemma «arc». 


Query arc 1,784 > Sort Right 1,784 > Sort Right 1,784 (467.17 per million) €) 
First | Previous Page |20 of 60/ Go | Next | Last Concordance is sorted. Jump to: [Iv] 


1 France, An... de fête et couronnées d'aubépine , allaient en long cortege par le Corso , sous des arcs de fleurs , et formaient des chœurs sur l herbe nouvelle , à L'abri des lauriers 

2 Dumas, Ale. quitter les choses les plus chères , et ce sera la première flèche qui partira de L’ are de L' exil; alors tu comprendras ce que renferme d ' amertume le pain de l'étranger , 
3 France, An... le temps de répondre : — Je sais, je sais . Vous êtes allée à Rome . Vous avez regardé L' arc de L'infáme Titus , ce marbre exécrable où L'on voit le chandelier à sept branches 

4 Viollet Le... arc de triomphe de L'Étoile et de quelques autres de nos monuments modernes : = L' arc de l'Étoile , par L’ admirable justesse de ses proportions , ne paraît qu'une porte 

5 Viollet Le... la brique , avant la cuisson , sur sa tranche que sur son plat . Seules , les briques des arcs de la balustrade supérieure sont moulées en claveaux . IL est clair aussi que la 

6 Vasari, Gi... Celui -ci avait | intention de le mettre à Saint-Pierre , sous le premier arc de la coupole ; comme il aurait encombré le sol , et qu ‘en vérité ce n'était pas sa 

7 Grandgeorg... . Dans les bas-cótés s ' ouvrent des chapelles correspondant à L'ouverture des arcs de la grande nef . Cette église contient de nombreuses fresques anciennes , 

8 Viollet Le... partent déjà les colonnettes B , qui montent jusqu ' aux naissances des arcs de la grande voûte . Ces colonnettes sont posées en délit de la base à la tablette C , 


9 Viollet Le... à ce triforium et relie L' arcature è la construction extérieure ; puis naissent les arcs de la grande voûte contre-buttés par les contre-forts extérieurs . Les fenêtres 
10 Viollet Le... ; et qui passent devant le groupe ABB pour venir sous L' assise M des chapiteaux des arcs de la grande voûte ; assise d ' un seul morceau . En D Le chapiteau du triforium . En E le 
colonnes latérales ОО continuent seules jusqu au linteau M qui contre-butte les arcs de La grande voûte . Al’ extérieur , il élève une pile Н en pierre afin de pouvoir 
et les enfants nus et emmaillottés que renferment les médaillons placés entre les arcs de la loggia de L'hôpital degli Innocenti , et qui sont vraiment admirables . ls 
‚ il jeta en bronze une Judith coupant la tête è Holopherne , qui fut placée sous un arc de la loggia et qui est une œuvre vraiment magistrale . Celui qui considérera la 

L'époque . Sur la voùte , fL fit quatre Sibylles et , en dehors de la chapelle , dans L' arc de la parol antérieure , la Sibylle de Tibur faisant adorer le Christ à L'empereur a 

ой fut martyrisé san Minfato , et où L' оп a retrouvé son corps , Au-dessus de L' arc de la porte qui falt face à Florence sont de belles fresques , par Michel di Ridotto 
en bas-reliefs , plutôt entièrement perdue q ' uécartée de la bonne route . Sur L' arc de la porte il fit trois statues en marbre , de grandeur naturelle et en ronde-bosse , 
colonnes qui se detachent des piliers pour monter jusq ' uà la nalssance des arcs de la vote . De méme encore le parti pris d employer dans toutes les parties de U 
de cette clef (7 ) . On observera qu ' ci la clef n est qu un omement détaché des arcs de la voûte ; cette clef n'a pas de fond et les arcs passent et se pénètrent derrière 
« Les lignes TR, TM, TZ, ТЕ donnent la projection horizontale de quatre des arcs de la voûte . Il en est de même des lignes O С, ОКЕ, OG , etc. Pour tracer les arcs ogives C] 
également en bois , passant sous les bases des piles engagées portant les arcs de La volte et venant se réunir au centre ( оу . Donjon). Cependant, à la fin du Ale — (3 
était pas logique pour des rationalistes . Mats , plaçant les nalssances de tous les arcs de la voûte au méme niveau pour éviter ces surfaces verticales , les architectes O 

qu'ici L'architecte a voulu opposer à la courbe des pressions exercées par les ares de la voûte une buttée oblique , résistante par sa masse et par la coupe de son profil , 

aussi larges que la demi-parof , le demier supérieur etant enferme dans | arc de la voûte et deux fois aussi large que chacun de ceux qui sont au-dessous . Цу en a 

. Dans le septième compartiment , qui a double Largeur et forme lunette , sous L' arc de la voûte , on voit la mort de la Vierge et son Assomption , avec un grand nombre d ' 
‘qui nous donne le demi-cercle KML ; nous rabattons L' arc doubleau PN , en tracant cet arc de manière que la clef soit un peu au-dessous du niveau de la clef de l arc ogive KL, et 

une élasticité beaucoup plus grande , et , par suite , plus de résistance qu'un arc de méme section construit d ' apres la méthode indiquée en B . Les constructeurs 
, tracés en HI sur la projection horizontale К , et alors , au lieu de bander les arcs de remplissage en moellons comme il est tracé en L, ils les poserent ainsi qu'il est 
la somptuosité du portail d'entrée , L'importance structurelle et la majesté de 1! arc de scène , le luxe des décorations intérieures , la variété des ressources 


DO 


29 Fernandez, .. , les statues sont en gypse et en paille , les gradins , la double galerie de loges et 1! are de scène en bois . Campromis entre le théâtre de cour et le théâtre public , le Farnèse [ш] 
10 Fernandez... de manière qu ‘elles soient toutes orientées vers la scène , développement de 1! arc de scène selon sa double fonction décorative et acoustique , équipement de la scène O 
First | Previous Page [20 of60[ Go] Next | Last Concordance is sorted. Jump to: |! vw] 


Fig.7. Risultati della ricerca di concordanze contenentila parola «arc», con classificazione 
in ordine alfabetico delle parole che seguono arc, grazie a “Sort/Right”. 
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Conclusione: analisi critica e sviluppi futuri 


Laricerca di un equilibrio formale e di un bilanciamento dei dati tra cosi tante 
lingue diverse costituisce senz’altro una sfida. In questo senso, la scelta dei testi 
tradotti & stata una decisione collegiale dei gruppi di tutte le lingue. La ricerca 
delle traduzioni delle opere precedentemente elencate ё stata infatti condotta 
sulla base della bibliografia di riferimento creata in comune. In questo modo so- 
no state selezionate per i testi francesi le traduzioni di Stendhal e Taine in altre 
lingue, peritesti tedeschi di Burckhardt e Goethe, di Ruskin per l'inglese, ecc. 
Ma sono soprattutto le numerose traduzioni dell'italiano Giorgio Vasari (le Vi- 
te de’ рїй eccellenti pittori, scultori, architettori, 1550) nelle diverse lingue su cui 
abbiamo tutti lavorato, che permetteranno di costruire un database parallelo 
essenziale a partire dai nostri diversi corpora (cfr Zotti 2017). Per il francese, si 
tratta per il momento di 65 vite tra Les vies des plus excellents peintres, sculpteurs 
et architectes, secondo le traduzioni di L. Leclanché e C. Weiss, che potremo an- 
che confrontare con quelle di A. Chastel. Questi testi, che hanno dato luogo a 
traduzioni e ritraduzioni da parte di specialisti di storia dell'arte nelle diverse 
lingue, non mancheranno di costituire uno strumento prezioso per la raccolta 
di equivalenti appartenenti ad un vocabolario specializzato in storia dell'arte. 
Costituiscono inoltre una ricca documentazione di informazioni sulle strate- 
gie traduttive adottate e sulla loro evoluzione nel tempo (cfr. Ballestracci 2018). 

L'analisi dei testi nelle traduzioni che abbiamo voluto inserire nel nostro cor- 
pus ha inoltre permesso di individuare alcune approssimazioni che ne metteva- 
no in discussione l'attendibilità. Se, infatti, abbiamo considerato i testi tradotti 
come aventi un valore e un interesse paragonabile ai testi di origine (Frawley 
1984), alcuni tipi di testi rilevanti per la nostra ricerca (siti web, guide turisti- 
che) hanno richiesto un controllo di affidabilità linguistica per essere inseriti a 
pieno titolo nel corpus. Abbiamo quindi effettuato una necessaria e preliminare 
selezione metodica, un vero e proprio ‘controllo di qualita’, almeno nella defini- 
zione di una prima versione pubblicata del corpus francese. Questa operazione 
consisteva in un confronto di un primo subcorpus di traduzioni conil corpus in 
«lingua naturale», che ci ha permesso di evidenziare anomalie nelle statistiche 
delle occorrenze confrontate e di eliminare alcuni testi (Farina, Billero 2018). 

Il fatto che, a differenza di altre lingue, il corpus francese contenga gran par- 
te dei dati sotto forma di dizionari (mentre la categoria [DIZ] è ancora assente 
nelle altre lingue), non dovrebbe sorprendere dal momento che la presenza ri- 
flette una tradizione accademica nazionale di cui abbiamo beneficiato. Abbiamo 
anche considerato l'introduzione di dizionari bilingue durante la creazione di 
corpora paralleli, che potrebbero aiutarci nella ricerca di equivalenti traduttivi. 

Come abbiamo detto, il nostro obiettivo iniziale era quello di mettere insie- 
me una tipologia testuale estesa sia in sincronia che in diacronia. Questa im- 
portante varietà di tipologie che abbraccia diversi secoli ha comportato alcune 
esitazioni riguardo alla classificazione dei subcorpora. Occorre distinguere tra 
testi tecnici appartenenti al campo dell'architettura e testi tecnici dell'arte? In 
particolare, il già citato dizionario di Viollet-le-Duc e quello di Félibien Des prin- 
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cipes de l'architecture, de la sculpture, de la peinture (1676) — quest'ultimo ancora 
in fase di ‘pulizia’ - potrebbero piuttosto essere classificati nella sottocategoria 
[ТЕС ART]o[DIZ TEC] (e non in [DIZ MON] perla prima ein [TEC - 
ARC] per la seconda), vale a dire nella categoria dei testi specialistici che rien- 
trano nel campo artistico in generale e/o che hanno una forma di dizionario. 
Questo senza dubbio ci porterà presto a fondere alcuni subcorpora. 

Inoltre, il patto di lettura cambia in base allo sviluppo delle arti e delle tecni- 
che e secondo i mezzi di comunicazione o secondo il medium utilizzato. I testi 
del Vasari erano originariamente testi destinati a specialisti dell'epoca e la loro 
diffusione in Europa consenti anche lo sviluppo di un lessico artistico specia- 
lizzato in tutte le lingue ed in particolare in un francese tecnico che si é costitu- 
ito sul modello dell'italiano a partire dal XVI secolo, per proseguire nei secoli 
successivi. Oggi, le Vite sono piuttosto considerate come raccolte di aneddoti 
sugli artisti e le loro opere. Allo stesso modo, le guide turistiche del XIX seco- 
lo dovrebbero essere classificate oggi, in base alla loro qualità letteraria, come 
diari di viaggio. 

D’altronde, il limite che ci eravamo imposti di prendere in considerazione come 
prioritariela città di Firenze ela Toscana, si staspostando perandare a comprendere 
altre città italiane che hanno suscitato l'interesse dei viaggiatori stranieri nel corso 
dei secoli. Abbiamo cosi iniziato a introdurre opere, capitoli o frammenti relativi 
ad altre città, in particolare di Edmond e Jules de Goncourt (L'Italie d'hier, 1855) 
perle città di Venezia, Parma, Modena, Bologna, Verona ecc. Questa espansione 
ci ha permesso di testare la possibilità di una ricerca per città o regione. 

Tutte queste osservazioni illustrano la peculiarità dei corpora che pubblichia- 
mo oggi, che consideriamo un primo importante risultato dopo un percorso di 
ricerca che il gruppo LBC conduce gia da quasi un decennio e che reca i segni 
di un work in progress. E ovvio che aggiunte e adattamenti trasformeranno que- 
sti corpora negli anni a venire, data la complessità del nostro lavoro in gruppi 
differenziati per lingua. La varietà degli usi che ne facciamo porterà a modifiche 
che saranno testate nelle nostre future ricerche. 
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Abstract (Italiano): In questo contributo si presentano i criteri per la realizzazione, le 
fasi di sviluppo e le possibili applicazioni del Corpus LBC russo, creato nell’ambito del 
progetto Lessico multilingue dei Beni Culturali (LBC). Il lavoro si compone di tre parti: la 
prima illustra il percorso e gli obiettivi del progetto e le fasi della sua realizzazione. La 
seconda espone i criteri di formazione dei Corpora multilingue LBC e descrive i generi 
testuali, gli autori e i titoli presenti nel corpus russo, offrendo una prima valutazione 
dell'attuale configurazione del corpus. La terza presenta le caratteristiche specifiche dei 
corpora LBC ei possibili usi del corpus russo, mettendo in evidenza come esso si presti 
ad analisi di tipo diverso in aree di interesse come il turismo, la traduzione specializzata. 


Parole chiave: linguistica di corpora, lessico, terminologia dell'arte, terminologia dei 
beni culturali. 


Abstract (English): This essay presents the criteria for the realization, the development 
phases and the possible applications of the LBC Corpus in Russian, created in the 
framework of the Lexicon of Cultural Heritage (LBC) project. The work is divided into 
three sections. Section 1 illustrates path and objectives of the project and the phases of 
its realization. Section 2 sets out the criteria for the formation of multilingual LBC Corpora 
and describes the textual genres, authors and titles present in the Russian corpus, 
offering a first assessment of the current corpus configuration. Section 3 presents the 
specific characteristics of the LBC corpora and the possible uses of the Russian corpus, 
highlighting how it lends itself to different types of analysis, in areas of interest such as 
tourism and specialized translation. 


Keywords: corpus linguistics, lexicon, art terminology, cultural heritage terminology. 


1. Dalla ricerca lessicografica al corpus LBC russo (e ritorno)! 


Quando decidemmo con A. Farina di dare vita a Firenze all'Unità di ricerca 
dedicata al lessico dei beni culturali (LBC), percepivamo con chiarezza di do- 
ver affrontare un tema fondamentale sia nell'ambito dei nostri studi sia dei no- 
stri insegnamenti di lingua. Questa problematica aveva infatti risvolti sensibili 
per l'attività di insegnamento, dal momento che molti nostri studenti trovava- 


! Il primo paragrafo ha per autore Marcello Garzaniti, il secondo Valentina Rossi, il terzo 


Natalia Zhukova. 


Valentina Rossi, University of Florence, Italy, valentina.rossi@unifi.it, 0000-0002-9466-112X 
Marcello Garzaniti, University of Florence, Italy, marcello.garzaniti@unifi.it, 0000-0002-4630-5374 
Natalia Zhukova, University of Florence, Italy, natalia.zhukova@unifi.it, 0000-0003-1176-1609 


FUP Best Practice in Scholarly Publishing (DOI 10.36253/fup best practice) 


Riccardo Billero, Annick Farina, María Carlota Nicolás Martínez (edited by), / Corpora LBC. Informatica 
Umanistica per il Lessico dei Beni Culturali, € 2020 Author(s), content CC BY 4.0 International, metadata 
CCO 1.0 Universal, published by Firenze University Press (www.fupress.com), ISSN 2704-5870 (online), 
ISBN 978-88-5518-253-9 (PDF), DOI 10.36253/978-88-5518-253-9 


VALENTINA ROSSI, MARCELLO GARZANITI, NATALIA ZHUKOVA 


no impiego in settori che richiedevano queste competenze, a cominciare dalla 
professione di guida turistica”. Quanti si sono impegnati nel progetto dell'Unità 
di ricerca LBC, ufficialmente approvato dopo un faticoso iter il 7.10.2013, ave- 
vano in primo luogo la percezione che esisteva uno iato profondo nella qualità 
della comunicazione linguistica fra le guide della città di Firenze d'uso corren- 
te (per esempio Bonechi) e gli addetti ai lavori nell'ambito dei beni artistici, a 
cominciare dagli studiosi di storia dell'arte, che dominavano il lessico specia- 
listico dell'italiano. Era poi sufficiente consultare i siti museali per constatare 
il monolinguismo dominante con un inglese spesso elementare, espressione di 
traduzioni non specialistiche. Erano peraltro davanti agli occhi di tutti i risul- 
tati raggiunti dalla lessicografia sia in Italia sia all'estero che da tempo si stava 
orientando all'elaborazione di banche dati. Questo emerse chiaramente in una 
delle prime giornate di studio, organizzate dall’Unitä di ricerca: “Lessico e Ban- 
che dati" (Firenze, Bologna 13.12.2013). 

Le relazioni avviate con l'Accademia della Crusca hanno contribuito a fa- 
vorire la percezione dei legami dellessico dei Beni Culturali con il patrimonio 
della lingua italiana e la tradizione del rinascimento fiorentino, in molteplici 
ambiti che andavano dall'architettura alla scienza culinaria, dalla letteratura 
alle competenze artigianali fino a toccare questioni relative a scienze estetiche 
e sociali, in cui beni materiali e immateriali appaiono profondamente connessi. 

In genere nel nostro lavoro si verificava la correttezza del lessico ricorren- 
do a dizionari generalisti o, se disponibili, a dizionari specialistici, verificando 
la qualità della comunicazione linguistica nei diversi ambiti dei beni culturali. 
Per questo é stato importante in una fase iniziale individuare i dizionari dispo- 
nibili nelle singole lingue per constatare come soprattutto i dizionari universali 
mostravano una serie di limiti e imprecisioni che rendevano questi strumenti 
scarsamente utili o persino dannosi per i traduttori e i mediatori linguistici. In 
ambito russo é sufficiente far riferimento a lemmi che appartenevano all'archi- 
tettura religiosa per incontrare nei dizionari, eredi dell'epoca sovietica, notevoli 
difficoltà, conseguenza del lungo periodo di ateismo di Stato. Più in generale si 
poteva osservare la limitatezza degli esempi forniti che spesso non illustrava- 
no la ricchezza semantica di taluni termini e soprattutto determinati usi speci- 
fici. Ancor piü gravi erano i problemi incontrati nell'uso dei dizionari bilingui. 

Una prima verifica delle difficoltà del lavoro con i dizionari é stata svolta at- 
traverso lericerche condotte da alcuni studenti nelle loro tesi di laurea, con un'a- 
nalisi delle guide della città di Firenze in lingua russa. Questi lavori sono stati 
oggetto di discussione e di riflessione nella sezione di russo della nostra Unità di 
ricerca, e più in generale con і colleghi delle altre lingue”. Nell'ambito della lingua 


Offriamo di seguito l'elenco tesi che ho seguito in collaborazione con N.N. Zhukova, e piü 
tardi con V. Rossi su guide in lingua russa o cataloghi di mostre. Fra parentesi é indicato 
l'anno accademico. Fra le tesi triennali: F. Cassari, Analisi lessicale dei nomi comuni del- 
la Guida Bonechi Florencija. Gorod i ego $edevry (2013-2014); C. Maccianti, Forme grafi- 
che e traduzioni nei nomi propri della Guida Florencija. Gorod i vse Sedevry (2013-2014); E. 
Guerra, Analisi lessicale della versione russa dell'opuscolo La primavera del Rinascimento, la 
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russa il lavoro & stato facilitato dalla possibilitä di consultare dizionari classici e 
contemporanei in rete in alcuni portali disponibili al pubblico, consentendo di 
confrontare le definizioni offerte dai dizionari monolingue russi con i diziona- 
ri monolingue dell'italiano, a cominciare dal prestigioso dizionario Treccani. 
Questo confronto ha fatto inevitabilmente emergere non solo la limitatezza di 
questi strumenti, ma soprattutto la complessità dell'eredità culturale della Rus- 
sia che guarda da una parte al mondo occidentale (con la mediazione francese 
e tedesca, ma anche italiana), mentre dall'altra rimane ancorata alla sua eredità 
bizantina che ha informato una parte significativa dellessico dei beni culturali, 
a cominciare per esempio dal lessico relativo all’iconografia. 

Lo studio delle guide ha comportato peraltro l'individuazione dei comples- 
si problemi connessi alla forma dei nomi propri nel processo di traslitterazione 
dall’alfabeto latino al cirillico (per es. le diverse ortografie di Santa Maria del 
Fiore) o di adattamento al russo, quando é possibile incontrare traduzioni per 
intero o parziali del sintagma che designa il nome proprio (per es. le diverse 
versioni di Porta Romana)’. In questo ambito diventava indispensabile consul- 
tare non piü soltanto i dizionari, ma anche le enciclopedie, a cominciare dalla 
tradizionale Grande Enciclopedia sovietica fino a quella più famosa dell'epoca 
dell'impero russo chiamata con il nome dei suoi curatori, Brokgauz-Efron (1890- 
1907)*. Alle nostre ricerche si sono accompagnate quelle dei nostri laureandi che 


scultura e le arti a Firenze 1400-1460 (2013-2014); M. Rinella, Analisi lessicale e pratiche 
traduttive dei nomi dal russo all' italiano. Le guide di Firenze di G. Casetta (2008) e di R. 
Nesti (2008) (2014-2015); V. Bracali, La guida turistica Montekatini Terme in lingua russa. 
Analisi del lessico dei beni culturali (2014-2015); M. Montagnani, A spasso per un corpus di 
Firenze. La linguistica dei corpora applicata a due guide fiorentine (2015-2016); L. Petruzzella, 
Larchitettura italiana in Russia: inquadramento storico e glossario della terminologia artistica e 
architettonica (2016-2017). Fra le tesi magistrali: C. Maccianti, Analisi del lessico dei beni cul- 
turali in un corpus delle guide di Firenze (2014-2015); V. Barbini, Comunicazione e divulgazio- 
ne dei beni culturali medievali. Analisi della traduzione russa dell'articolo Spiritualità bizantina 
e latina nelle «Madonne» di Giotto di Timothy Verdon (2014-2015). Connesse a questi 
lavori per l'approccio metodologico sono le seguenti tesi magistrali: G. Tarquini, Il libro 
di cucina di S. A. Tolstaja. Un percorso gastronomico tra elementi autoctoni e allogeni (2014- 
2015); E. Guerra, Il viaggiatore incantato di N. S. Leskov. Analisi della terminologia equestre 
russa, a confronto con le versioni italiana ed inglese (2015-2016). La prima tirocinante LBC per 
la sezione di russo, Maccianti, ha elaborato sulla base dei lavori di tesi precedenti una lista 
dei nomi propri e comuni con le loro definizioni in italiano e in russo presenti nelle guide e 
ha messo a punto una bibliografia sulle guide turistiche russe di Firenze. 
Sulla tematica N.N. Zhukova é intervenuta all'Accademia delle arti del disegno di Firenze 
con una relazione sul tema Difficoltà nella trascrizione dei nomi italiani e complessità della tra- 
duzione del lessico storico-artistico in russo (2014). 
^ Sulla tematica si segnalano la relazione di M. Garzaniti Guideline proposition for a multilin- 
gual cultural heritage dictionary of Florence, presentata alla X Scuola internazionale di lessico- 
grafia "Life beyond Dictionaries" (12-14 settembre 2013; Garzaniti 2015, ma si veda anche il 
precedente Garzaniti, Farina 2013), e l'intervento di N.N. Zhukova, Per una nuova guida di 
Firenze in lingua russa presentato alla conferenza La guida turistica come luogo d'incontro tra 
lessico e immagini dei Beni Culturali (Pisa-Firenze, 11-12 giugno 2015) (Zhukova 2018). 
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hanno imparato a percepire le modalità e l'importanza delle trascrizioni e della 
resa dei nomi propri in russo che spesso, come sappiamo, ё mutata nel tempo. 

La complessa problematica legata ai dizionari e gli sviluppi più recenti della 
lessicografia hanno portato alla necessità di costruire delle banche dati sulla cui 
base si sarebbe potuto costruire un nuovo dizionario. La necessità di attingere 
alle fonti della formazione dellessico dei beni culturali ha condotto alla ricerca 
delle sue origini, all'epoca del rinascimento fiorentino e italiano, quando di fatto 
si é sviluppato il lessico della storia dell'arte con la composizione delle famose 
Vite de’ рїй eccellenti pittori, scultori e architettori italiani di Giorgio Vasari (1550, 
1568). In questo ambito stato importante stabilire dei contatti con la Fonda- 
zione Memofonte, che possiede un’ importante banca dati degli scritti di Vasari’. 
Le sue Vite possono essere considerate un punto di riferimento indispensabile 
perla formazione del lessico italiano dei beni culturali, che rappresentö per se- 
coli il punto di riferimento per l'arte e l'architettura in Europa‘. 

Ci siamo resi immediatamente conto che le versioni delle Vite nelle diverse 
lingue potevano costituire una base importante perlo studio dellessico dei beni 
culturali. Nell'ambito del russo N.N. Zhukova, fra i primi membri dell’Unitä, 
si incaricó di svolgere una ricerca che ha consentito di individuare più di una 
traduzione delle Vite a cominciare dal XIX secolo. Queste diverse versioni testi- 
moniano non solo il processo di standardizzazione del lessico dell'arte e dei beni 
culturali nella lingua russa, ma più in generale danno conto dei diversi approcci 
alla traduzione che riflettono la complessità dell'eredità culturale della Russia. 
Grazie anche alla presenza di studenti di madrelingua russa é stato possibile svi- 
luppare dei lavori di ricerca confrontando le diverse traduzioni in lingua russa 
delle Vite di Vasari, lavori che hanno condotto a interessanti risultati? e che spe- 
riamo possano essere proseguiti in futuro da G. Siedina (membro dal 2018)*. 

Fin dall'inizio dunqueuna delle banche dati fondamentali doveva contenere 
le versioni delle Vite di Vasari, come recita la prima formulazione del progetto 
dell’Unita di ricerca, in cui si proponeva di procedere «in due diverse direzio- 
ni: lo studio delle traduzioni di opere classiche del Rinascimento fiorentino a 
cominciare dalle traduzioni delle Vite del Vasari, come pure la creazione di una 
banca dati del lessico delle guide di Firenze nelle diverse lingue. In seguito si 
potrà prevedere di incrementare queste banche dati che serviranno a elaborare 


Cfr. <https://www.memofonte.it/ricerche/giorgio-vasari/>. 

Per una dettagliata presentazione alla questione si veda Motolese 2012. 

Facciamo riferimento in particolare alle tesi magistrali di C. D'Ambrosi, А.С. Gabricevskij 
e la traduzione della Vita di Giotto di Vasari (2013-2014) e di E. Novikova, La vita di Giotto 
di Giorgio Vasari nelle traduzioni russe di Ju. N. Verchovskij (1933) e di A. I. Venediktov 
(1956) (2014-2015). Ai lavori sulle versioni del Vasari si possono aggiungere altri lavori di 
tesi magistrale che hanno affrontato tematiche importanti per la ricezione del lessico rina- 
scimentale in Russia: V. Alderighi, Leonardo in Russia: la ricezione della sua figura e del suo 
lessico (2014-2015); S. Stefanini, La civiltà del Rinascimento in Italia di Jacob Burckhardt in 
Russia. Analisi lessicale della descrizione dell'uomo (2017-2018). 


Sulla ricezione di Vasari in Russia si veda anche Carbone 2020. 
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delle schede lessicografiche che potranno essere consultate in un portale dedi- 
cato» (7.10.2013). Sulla base dunque di queste banche dati si sarebbe costruito 
un dizionario che sarebbe stato disponibile a tutti online conl'illustrazione dei 
lemmi, l'individuazione di una rete semantico-tematica e persino approfondi- 
menti enciclopedici con la collaborazione di storici dell'arte e storici. Per queste 
ragioni furono condotti degli studi approfonditi per elaborare una scheda mo- 
dello in cui dovevano confluire i materiali offerti dalle banche dati”. 

In diversi seminari e convegni & stato presentato il progetto dell'Unità di 
ricerca, i suoi obiettivi principali ei primi risultati raggiunti. Fra questi si deve 
ricordare la succitata X Scuola internazionale di lessicografia (Ivanovo, Firen- 
ze, 12-14 settembre 2013), organizzata con O. Karpova (Università Ivanovo), a 
cui hanno partecipato diversi membri dell’Unitä di ricerca, i cui atti sono stati 
pubblicati presso la Cambridge Scholars Publishing'?. Questo evento ha segnato 
l'inizio della collaborazione con Karpova e la scuola lessicografica di Ivanovo" 
cheabbiamo conosciuto nel corso dei seminari organizzati dalla Fondazione Ro- 
mualdo Del Bianco, una fondazione fiorentina che da molti anni svolge un'ope- 
ra meritoria di relazioni con il mondo accademico russo. Con il sostegno della 
Fondazione é stato organizzato il seminario internazionale "Heritage Lexico- 
graphy as Supporting Tool for International Council on Monuments and Sites 
(ICOMOS)" (Firenze 21-23 luglio 2014), a cui hanno partecipato specialisti di 
diversa provenienza e di cui sono stati stampati gli atti". 

Successivamente, nel corso del secondo incontro organizzato presso l'Ac- 
cademia delle arti e del disegno (Firenze), dedicato al "Progetto per un lessico 
multilingue dei Beni Culturali. Comunicare il patrimonio artistico e culturale 
fiorentino" (Firenze, 27 gennaio 2015), insieme a M. Perotto e N.N. Zhukova, 
abbiamo presentato la relazione: La traduzione del lessico storico-artistico dall’i- 
taliano al russo: complessità e problemi. Nel frattempo si é concretizzato il pro- 
getto di una piattaforma in rete dedicata con la finalizzazione del contratto di 
edizione conla Firenze University Press perla pubblicazione del Portale digitale 
“Lessico per i Beni Culturali". 


Nel corso della ricerca in questo ambito sono stati analizzati una serie di lemmi per testare 
la struttura della scheda informatica da utilizzare per la creazione del dizionario on-line. In 
particolare sono state preparate le schede: Cimabue, fiorentino, Giotto, pilastro, pittore, ta- 
vola, tempera, tondo. Tutti i membri della sezione, ma anche la tirocinante Maccianti hanno 
collaborato alla creazione e alla revisione delle medesime offrendo il loro contributo. Nel 
frattempo alla tabella dei dizionari della lingua russa, M. Perotto ha aggiunto l'indicazione 
di alcuni fra i più importanti portali dedicati alla tematica. 

? Karpova, Kartashkova 2015. 

Cfr. Karpova 2011. In particolare si segnala il progetto relativo a un nuovo dizionario dedicato 
alla descrizione del ruolo di Firenze nella creazione artistica di scrittori, pittori e altri artisti: 
Florence in the Works of World Famous People: Encyclopedic Associative Dictionary for Guides and 
Tourists dedicato agli studenti, ma molto interessante sul piano metodologico (Karpova 2009). 
2 Cfr. in particolare il nostro intervento sugli strumenti lessicografici Garzaniti 2014. 

Cfr. a questo proposito il paragrafo successivo, in particolare sulla sezione del portale che 
riguarda la lingua russa. In quel periodo si era progettata con N.N. Zhukova la presentazio- 
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Nell'ambito della sezione dell’ Unita di ricerca dedicata alla lingua russa si 
sono sviluppate nuove collaborazioni con i colleghi di istituzioni accademiche 
in Russia, fra cui si segnala l’Istituto della lingua russa V.V. Vinogradov, diretto 
allora da A. Moldovan. Questo ha consentito di evidenziare rispetto alle altre 
sezioni i particolari approcci metodologici sviluppati dalla lessicografia russa, 
a cominciare da una percezione più viva della diacronia con studi avanzati di 
lessicografia storica del russo, connessi alle nostre ricerche in ambito filologico 
e storico-culturale, fino alla riflessione sulle strette relazioni fralingua e cultura 
testimoniata in particolare dallo sviluppo della teoria della cosiddetta «visione 
del mondo» (kartina mira)". 

Nel corso del 2014 la sezione di russo si è arricchita della collaborazione di M. 
Perotto dell’Università di Bologna, autrice di importanti lavori in ambito socio- 
linguistico, che ha fatto il suo ingresso nell'Unità nel luglio 2014, collaborando 
alla redazione delle schede, e che é molto attiva nelle iniziative promosse in col- 
laborazione fra le nostre università. Nell'ottobre 2014 ha iniziato a collaborare 
con noi F. Rossi, che abbiamo invitato nella nostra Unità per le sue particolari 
competenze grazie alla sua formazione nell'ambito delle Belle arti e dell'archi- 
tettura sia in Italia che in Russia, dove per anni é stata docente al prestigioso 
MArchl (Mosca), mentre ora è collaboratrice del Kunsthistorisches Institut di 
Firenze. In particolare per la formazione del lessico dei beni culturali in Rus- 
sia sono importanti i suoi studi sull eredità di Palladio nell'architettura russa". 

Particolarmente utile sul piano didattico é stato il volume dedicato ai Mille 
anni di architettura italiana in Russia, a cui ha collaborato F. Rossi, come autrice 
e traduttrice”. Dal momento che si tratta di un volume pubblicato nelle due lin- 
gue sotto l'egida della nostra ambasciata a Mosca, agli studenti sono stati forniti 
isingoli capitoli in lingua russa e italiana proponendo di individuare in ciascun 
articolo il lessico dei beni culturali e di cercarne le definizioni presenti nei di- 
zionari piü rilevanti della lingua russa e della lingua italiana". Confrontando 


ne della parte russa del portale al convegno MAPRIAL (Granada 2015), che peró non si é 
potuto realizzare. 

Cfr. per un'introduzione Apresjan 2006. Per un approccio critico cfr. Gebert 2006. 

5 Cfr. Rossi 2010; Rossi 2013. 

1 Svidkovskij, Batalov, Rossi 2013. 

Si fa riferimento alle seguenti tesi triennali: S. Ippoliti, Mosca e l'architettura del Rinascimento di 
D. Svidkovskij: un'analisi lessicografica (2017-2018); J. Platia, Dal primo Novecento agli anni tren- 
ta di F. Rossi: parole e concetti della cultura italiana nell'architettura russa e sovietica (2018-2019); 
С. Cecchi, Da Pietro il Grande a F.B. Rastrelli di D. Svidkovskij: parole e concetti di architettura 
nel Settecento russo (2018-2019); M. Baldini, Il tema italiano nell’architettura russa dell’Otto- 
cento e di inizio Novecento di Dimitrij Svidkovskij: analisi del lessico architettonico (2018-2019); 
L. Cruciata, La creatività rinascimentale nell’architettura russa di A. Batalov: analisi semantica e 
lessicografica del linguaggio architettonico (2019-2020); A. Giovannetti, Il lombardo romanico 
nell’architettura di Vladimir di D. Svidkovskij. Parole e concetti per descrivere l'arte medievale russa 
(2019-2020); A. Guidalotti, Al tempo di Caterina II di D. Svidkovskij. Analisi della terminologia 
architettonica (2019-2020). Fra le tesi magistrali: F. Cassari, Il Cremlino, una fortezza d'arte 
italiana e russa (2015-2016). A queste tesi si devono aggiungere alcuni lavori simili per tema- 


106 


IL CORPUS LBC RUSSO 


le diverse definizioni dei lemmi e con l'aiuto del contesto in cui questi si incon- 
trano, é stato possibile individuare i termini che creano difficoltà nel passaggio 
da una lingua all'altra, soprattutto per la diversa area semantica. Si prospetta in 
futuro una ricerca che raccolga i risultati dell'analisi dei singoli capitoli e che 
potrebbe rappresentare la base di un nuovo dizionario di architettura russo- 
italiano, italiano-russo. 

Grazie alla summenzionata Fondazione Del Bianco, siamo entrati in contatto 
anche con E.B. Genieva, direttrice della Biblioteca statale delle letterature stra- 
niere *M.I. Rudomino" (Mosca), che nel 2013 ha offerto alla nostra Biblioteca 
umanistica una serie di volumi in lingua russa pubblicati dal Rudomino, fra cui 
due volumi importanti, intitolati Viaggio a Firenze, che raccolgono le testimo- 
nianze della letteratura russa sulla nostra citta'*. Non meno importanti sono stati 
i contatti con l'Istituto di filosofia dell'Accademia delle scienze, in particolare 
con A. Kara-Murza, autore di fortunati saggi e guide dedicate alla presenza rus- 
sa nella città italiane, fra cui ovviamente spicca Firenze, e O.I. Kusenko, che si 
occupa delle ricerche degli studiosi russi nell'ambito del Rinascimento italia- 
no. È importante infatti sottolineare che lo studio del lessico dei beni culturali 
per quanto riguarda la Russia è inevitabilmente intrecciato con la questione più 
complessa della ricezione dell'umanesimo e del Rinascimento in Russia e con 
la presenza dell'emigrazione russa in Italia dopo la Rivoluzione. Si tratta di un 
tema di fondamentale importanza perla storia della cultura russa a cui sono sta- 
te dedicate una serie di ricerche". Nell'ambito dell'attività didattica proprio in 
questa direzione abbiamo promosso lo studio dellessico fondamentale che carat- 
terizza la versione russa del classico saggio di J. Burckhardt sul Rinascimento”. 

A partire dal 2016, tenendo conto delle difficoltà legate alla creazione delle 
schede lessicali che si basavano principalmente sui dizionari e sulla spinta di C. 
Nicolás Martínez con la sua pluriennale esperienza nell'ambito della linguisti- 
ca dei corpora, l’ Unità di ricerca si è orientata alla creazione di un proprio cor- 
pus del lessico dei beni culturali. Personalmente abbiamo potuto verificare la 
correttezza e la fruttuosità del metodo proposto, quando abbiamo assegnato a 
un nostro laureando, diplomato in informatica, il compito di creare un limitato 
corpus di guide di Firenze in lingua russa adottando il programma SketchEn- 
gine per analizzare il lessico in esso contenuto". È stato assolutamente evidente 


tica e metodologia: A. Gennaioli, I termini dell’architettura ecclesiastica russa (2012-2013); E. 
Moroni, Gli architetti italiani in Russia tra fine Quattrocento ed inizi Cinquecento (2015-2016). 
18 Genieva 2009; Genieva, Fridstejn 2009. 
? Cfr. Tonini 2012. 


20 


Cfr. supra n.7. 
2! La succitata tesi di Montagnani ha applicato il software SketchEngine per l'analisi di un pic- 
colo corpus formato da alcune guide turistiche di Firenze in lingua russa (Nesti, Casetta), 
rendendo disponibile a studenti e colleghi un PowerPoint di istruzione del programma in 
vista di ulteriori ricerche. Questa metodologia é stata applicata nella succitata tesi magistra- 
le di Maccianti per analizzare il lessico dei beni culturali fiorentini in lingua russa sulla base 


delle guide Bonechi e Touring Club Italiano in versione russa. 
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il salto di qualità che l’adozione dei nuovi programmi informatici e della lingui- 
stica dei corpora puö portare all’analisi del lessico. Del resto da questo punto 
di vista avevamo ormai sotto gli occhi uno strumento fondamentale per la les- 
sicografia russa, da quando ё stato creato il Corpus nazionale della lingua rus- 
sa (<https://ruscorpora.ru>), che sul modello di altri corpora raccoglie oramai 
una quantità straordinaria di testi che possono essere interrogati sviluppando 
ricerche sia in ambito lessicale che in ambito grammaticale. Sitratta comunque 
diun mare magnum che fral’altro comprende anche corpora dei testimedievali 
e moderni che hanno preceduto la nascita del russo standard. Fra i promotori 
del Corpus nazionale si annovera anche il succitato Istituto della lingua russa. 

La creazione delle banche dati che raccolgono testi storici artistici e lettera- 
ri su Firenze e Toscana, che dovrà essere la base di partenza per un innovativo 
Dizionario plurilingue destinato a specialisti di storia dell'arte e lessicografia, 
ma anche a guide turistiche e traduttori, é stato realizzato sotto la guida di Ni- 
colás Martínez, Farina e R. Billero?. Nel momento in cui é stata decisa la crea- 
zione di banche dati delle diverse lingue si é costituito all'interno della nostra 
sezione un gruppo dilavoro guidato da V. Rossi (che collaborava già dall'inizio 
del 2016), insieme a M. Perotto, N.N. Zhukova e M. Gasanova Mijat. Il grup- 
po ha elaborato, anche con l'aiuto di alcuni tirocinanti (Bucelli, Gorbacheva e 
Lichacheva) una serie di testi che apparentemente possono apparire non omo- 
genei, ma che in realtà riflettono proprio le ricerche ele indagini che sono state 
condotte negli anni precedenti e che abbiamo voluto esporre nelle pagine pre- 
cedenti. Si spiega cosi la centralità delle versioni russe delle Vite del Vasari, ma 
allo stesso tempo la presenza di alcuni dei testi contenuti nel volume Mille anni 
di architettura italiana in Russia, le testimonianze dei viaggiatori russi a Firenze, 
ma di questo si parlerä piü in dettaglio nel paragrafo successivo. 

Cilimitiamo solo a sottolinearel'importanza di attingere a banche dati spe- 
cifiche perlo studio dell’lessico dei beni culturali, come abbiamo potuto consta- 
tare quando abbiamo sviluppato la nostra ricerca sul termine frjaz che designa 
gli architetti italiani attivi in Russia fra la fine del Quattrocento e l'inizio del 
Cinquecento, uno studio presentato al Convegno internazionale LBC - Ce- 
SLiC “Comunicare il patrimonio artistico e culturale nella società digitale plu- 
rilingue” (Bologna, 13-14 dicembre 2018)”. La sua presenza nelle fonti presenti 
nella banca dati LBC russo consente di orientare in maniera molto piü precisa 
la ricerca nell'immenso Corpus nazionale della lingua russa°*. 


2. | corpora multilingue LBC e il corpus russo 


L'Unità di ricerca sul Lessico multilingue dei Beni Culturali (LBC), fra gli obiet- 
tivi del progetto, si prefiggeva: la realizzazione di una piattaforma web di rife- 


? Cfr. per una presentazione generale Billero, Nicolás Martínez 2017; Billero, Farina 2018. 
23 Garzaniti 2020. 


24 Ivi. 
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rimento per l’uso e lo studio del lessico dei Beni culturali; la creazione di una 
banca dati con i corpora delle lingue coinvolte nel progetto; la compilazione di 
un dizionario multilingue di termini che utilizzi come risorsa la banca dati”. 
Uno degli obiettivi principali del progetto del gruppo di ricerca LBC infatti «est 
de constituer des dictionnaires monolingues de huit langues différentes en fon- 
ction d'un usage précis relié à un objet particulier: la description (et traduction 
de descriptions) du patrimoine toscan principalement dans des textes de vul- 
garisation (guides touristiques, sites de musées, etc.)»?*, 

Primariamente per questo scopo sono state create delle banche dati testuali 
nelle diverse lingue del progetto”, che si andranno mano a mano completando 
nella forma di un Work in progress e che possono essere utilizzate per svariati 
compiti: dalla creazione di nomenclature alla stesura di schede lessicografico/ 
terminologiche monolingui e di schede di traduzione che colleghino tra loro le 
nomenclature delle diverse lingue (peril momento solo perla traduzione dall'i- 
taliano verso le altre otto lingue del progetto)”. 

L'obiettivo principale del progetto LBC é colmare la mancanza di strumen- 
ti adeguati e di una formazione adeguata per la diffusione delle conoscenze sul 
patrimonio artistico, promuovendo cosi lo sviluppo e la realizzazione di studi, 
ricerche e altre attività incentrate sul lessico delle diverse lingue in relazione al- 
la lingua italiana nell'ambito del patrimonio artistico e culturale, a partire da 
quello della città di Firenze. In tale prospettiva é prevista a breve anche la pub- 
blicazione dei «lessici essenziali del linguaggio dell'arte» del gruppo di ricer- 
ca LBC, che rappresentano un'altra tappa di questo progetto a lungo termine: 
a partire dai corpora LBC le singole sezioni hanno estratto dalloro corpus un 
elenco di parole rappresentative della lingua dell'arte italiana, con relativi con- 
testi d'uso (concordanze). 

Itesti di maggiore rilievo che si é ritenuto dovessero essere inseriti per primi 
all'interno delle banche dati di tutte le lingue sono le traduzioni di una serie di 
opere in lingua italiana, tali da poter essere considerate testi "fondatori" per la 
creazione di una terminologia dell'arte o testi classici dell'arte italiana”. La re- 
alizzazione di corpora multilingue costituiti in parte consistente da traduzioni 
di quei testi "canonici", e in primis delle Vite di Vasari, prevede la possibilità di 
sfruttare l'analisi delle traduzioni come utile risorsa per arrivare a creare le se- 
zioni lessicali bilingui dei futuri Dizionari LBC®. 


25 


Sulle origini del progetto LBC si veda Garzaniti, Farina 2013: 504 e ss. Per il progetto del 
Dizionario relativamente alla lingua russa si veda Garzaniti 2015: 138 e ss. 

26 Farina, Billero 2018: 109. Per maggiori informazioni e una descrizione completa del proget- 
to vedi il link <http://www.lessicobeniculturali.net/contenuti/il-progetto/818>. 

Per una descrizione dettagliata della creazione della banca dati si veda Billero 2020. 

Le lingue del progetto sono: cinese, francese, inglese, tedesco, italiano, portoghese, russo, 
spagnolo e turco. 

29 Billero, Nicolás Martínez 2017: 210. 


3° у, Farina, Billero 2018: 108; Zotti 2017: 107. 
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Una banca dati, quindi, che é composta dai corpora delle diverse lingue coin- 
volte nel progetto, corpora contenenti testi che illustrano il patrimonio cultu- 
rale: si va da testi tecnici sulla storia dell'arte a libri divulgativi, come le guide 
turistiche e i libri di viaggio, che trattano l’arte e la cultura italiana (ibidem). I 
criteri di selezione dei testi sono stati: la rilevanza storico-culturale dell'opera 
nell’ambito specifico di studio (es. i testi di Vitruvio o Leonardo); la diffusione 
internazionale di un'opera in rapporto all'ambito di studio (es. le Vite di Vasari); 
il prestigio dato a livello internazionale al patrimonio italiano da parte di un'o- 
pera (es. i testi di Stendhal o Ruskin); la specificità dell'argomento in rapporto 
alla storia dell'arte italiana ed in particolare della Toscana (es. la Geschichte der 
Renaissance di Burckhardt)*!. 

I corpora delle diverse lingue sono perciò eterogenei, composti da testi di di- 
verso tipo, appartenenti ad epoche diverse (racconti di viaggio, guide turistiche, 
saggi sull'arte italiana, biografie di artisti...), scelti perd per un comune interesse 
peril patrimonio italiano. Il connubio di queste diverse tipologie di testi, anche 
se puó apparire contraddittorio, é in realtà fondamentale per studiare l'attuale 
stato del lessico dei beni culturali proprio in relazione alla sua formazione nelle 
origini e alla creazione di uno standard ben riconoscibile. 

La banca dati LBC? consente una consultazione mirata dei diversi corpora 
e sub-corpora, permettendo di operare confronti, quali, ad esempio, "italiano 
lingua originale" vs. "russo lingua originale", oppure "russo lingua originale" 
vs. "russo lingua di traduzione", oppure "russo di registro tecnico" vs. "russo di 
registro letterario". Queste operazioni di confronto possono aiutare a identifi- 
care le approssimazioni o gli errori di traduzione e costruire cosi informazioni 
lessicografiche comparative di qualità? 

Questa banca dati multilingue é stata progettata per avere un ampio uso 
specialistico, sulla base di tre requisiti fondamentali: «disporre di materiale 
linguistico per documentare le voci del dizionario multilingue LBC; disporre 
di materiale linguistico per effettuare studi linguistici, letterali o culturali; di- 
sporre di testi con i quali far conoscere al grande pubblico il patrimonio cultu- 
rale di Firenze e della Toscana»°*. 

Il metodo scelto per la realizzazione dei corpora, comune a tutte le squadre 
linguistiche del gruppo LBC, é stato concepito, come ben sintetizzano E. Carpi 
e A. Pano Alamán, a partire da alcuni aspetti propri della lingua dell'arte come 
linguaggio settoriale: da un lato, «la genesi e l'evoluzione del linguaggio a fini 
artistici spiegano perché le parole legate all'arte e alla critica d'arte siano lontane 


Billero, Nicolás Martínez 2017: 208. In particolare, sono state individuate le seguenti ca- 
tegorie e sottocategorie: Divulgativo — Blog, Divulgativo - Guida, Divulgativo — Rivista, 
Dizionario - Monolingue, Dizionario - Bilingue/plurilingue, Letterario — Biografico, 
Letterario - Fiction, Letterario – Saggistica, Tecnico – Architettura, Tecnico – Arte, Tecnico 
- Edilizia, Tecnico – Enogastronomia, Tecnico - Storia. 

Cfr. «http://corpora.lessicobeniculturali.net/ru/». 

55 Farina, Billero 2018: 109. 

* Billero, Nicolás Martínez 2017: 206. 
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dal costituire un insieme di termini ed espressioni univoche»; dall'altro, «illes- 
sico dell'arte si colloca a metà tra i linguaggi specialistici eillinguaggio comune, 
e presenta un alto grado di variazione a seconda del tipo di testo in cuisi trova». 

Suquesta base, «etenendo conto della natura eterogenea dellessico artistico 
e della varietà di tipologie discorsive in cui si manifesta» i gruppi di ricerca del 
Progetto LBC hanno stabilito due grandi blocchi tematici. In una prima fase so- 
no stati raccolti testi relativi alla città di Firenze quale città d'arte per eccellenza 
(opere originali o tradotte dall'italiano, dal francese, dal tedesco e dall'inglese, 
pubblicate tra il XVI e il XX secolo): «questi testi sono stati selezionati per la 
loro rilevanza culturale e interculturale: si tratta infatti di opere letterario-bio- 
grafiche e di viaggio, che consentono di comprendere i diversi punti di vista le- 
gati all'arte italiana e di ampliare cosi la scelta terminologica». In una seconda 
faseé stata raccolta una serie di testi tecnici sull'architettura e l'arte: «in questo 
caso, la priorità é stata data ai trattati, ai manuali e agli scritti della critica che 
rappresentano una fonte essenziale di terminologia specialistica; come nel caso 
precedente, sono state incluse sia opere originali che opere tradotte». 

Le vite de’ più eccellenti pittori, scultori, e architettori di Giorgio Vasari rappre- 
sentano la fonte principe dei corpora multilingue in quanto Vasari introduce nel 
suo trattato termini che uniscono illessico tecnico e alcuni concetti che antici- 
pano il linguaggio della critica d'arte”. 

Nel corpus russo il primo gruppo di testi corrisponde a opere ormai classi- 
che come le Immagini d'Italia di Pavel Muratov (Obrazy Italii, 1913), il saggio di 
Nikolaj Berdjaev Il sentimento dell'Italia (Cuvstvo Italii, 1915), le memorie di viag- 
gio di Nikolaj Anciferov (Ottizna moej duši: vospominanija o putesestvijach v Ita- 
liju, 1938-1940), memorie legate al viaggio in Italia di personaggi di spicco come 
la principessa Ekaterina Daškova (Zapiski knjagini, 1802), di artisti come Msti- 
slav Dobuzinskij (Vospominanija, 1922) e Michail Nesterov (O perezitom, 1928). 
Figurano in questo gruppo anche testi poetici di Konstantin Batjuskov, Anton 
Del'vig, Aleksandr Puskin, Petr Vjazemskij, Aleksandr Blok, Nikolaj Gumilev, 
Dmitrij} Merezkovskij, Anna Achmatova, Iosif Brodskij, ispirati a immagini-sim- 
bolo della cultura italiana, nonché impressioni di viaggio affidate alle lettere di 
artisti e scrittori come Petr Cajkovskji, Valentin Serov, Fedor Dostoevskij, An- 
ton Cechov. Vi figurano infine opere tradotte da autori stranieri, quali il diario 
di viaggio Roma, Napoli e Firenze di Stendhal (Rim Neapol' Florencija, 1978 [Ro- 
me, Naples et Florence, 1817], le Notti fiorentine di Heinrich Heine (Florentijskie 
noci, 1971 [Florentinische Náchte, 1836]), le Mattinate fiorentine di John Ruskin 
(Progulki po Florencii, 2016 [Mornings in Florence, 1881]), Il diario fiorentino di 
Ranier Maria Ril'ke (Florentijskij dnevnik, 2001 [Das Florenzer Tagebuch, 1898]). 

Nel secondo gruppo rientrano sia opere tradotte, come i testi di Leon Bat- 
tista Alberti (Desjat' knig o zodcestve, 1935 [I dieci libri de l'architettura, 1500]), 


35 Carpi, Pano Alamán 2020. 
3% Ibidem. 
7 Ibidem. 
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Andrea Palladio (Cetyre knigi ob architekture, 1938 [I quattro libri dell'architettu- 
ra,1570?]) e Leonardo da Vinci (Traktat o Zivopisi, 2010 [Trattato della pittura, 
1500?]), le Istorie fiorentine di Machiavelli (1526 [Istorija Florencii, 1973) ), l'au- 
tobiografia di Cellini (Zizn’ Benvenuto, syna maéstro DZovanni Cellini, 1958 [Vita 
di Benvenuto Cellini, 1539]), sia saggi di carattere generale sulla storia dell'arte 
rinascimentale di Heinrich Wölfflin, Ernst Gombrich, Bertrand Zhestaz; sia 
opere originali in russo: testi di epoca sovietica, come il manuale di Michail 

Alpatov L'arte italiana dell'epoca di Dante e Giotto (Ital' janskoe iskusstvo épochi 

Dante i DZotto, 1939) e il Breve dizionario di termini dell'arte figurativa (Kratkij 

slovar’ terminov izobrazitel'nogo iskusstva, 1965) e manuali più recenti, come 

quelli di A. Kaptikov e A. Plesivcev, dedicati alla storia dell'arte rinascimenta- 
le, ricchi di termini culturalmente rilevanti relativi alla storia dell'arte italiana. 

Il Corpus russo comprende 248 testi per un totale di piü di 1.900.000 parole 
(<http://corpora.lessicobeniculturali.net/ru>). 

Ogni corpus LBC può essere utilmente descritto a partire dalla classifica- 
zione dei testi che lo compongono, individuando cosi utili comparazioni, quali 
ad esempio: 

1. “testi di traduzione" (147/248, pari al 59% del corpus)? vs. "testi originali 
russi" (101/248, pari al 41%). Le traduzioni dall'italiano ovviamente preval- 
gono (138/147), corrispondendo al 9496 dei testi tradotti. Le Vite di Vasari 
costituiscono 1'88% delle traduzioni dall'italiano e corrispondono all’83% 
del sottocorpus “testi di traduzione”; 

2. "testi tecnici o dizionari" (171/248, pari al 69% del corpus)” vs. "testi lette- 
rari o divulgativi” (77/248, pari al 31%)". 


All'interno del sottocorpus "testi di traduzione", la percentuale di "testi tec- 
nici o dizionari" (140/147) e pari al 95%, mentre quella di "testi letterari o di- 
vulgativi" (7/147) é pari al 5%. All'interno del sottocorpus “testi originali russi" 
invece la percentuale di “testi tecnici o dizionari” (31/101) è pari al 3196, mentre 
quella di "testi letterari o divulgativi" (70/101) & pari al 69%. Nel corpus russo 
risulta quindi evidente una forte disparità tra la percentuale di testi tecnici pre- 
sente nel sottocorpus "testi di traduzione" (9596) e la percentuale di testi tecni- 
ci presente nel sottocorpus "testi originali russi" (31%). La grande presenza di 
traduzioni dal Vasari, che sono classificate come "Tecnico - Arte", incide forte- 
mente su queste percentuali. 

Tale disparità sarà oggetto di un'ulteriore analisi nell Introduzione al Lessico 
essenziale dell’arte elaborato dal gruppo di ricerca di lingua russa del progetto 
LBC (di prossima pubblicazione). 


38 Dei 147 testi di traduzione 138 sono traduzioni dall’ italiano (di cui 122 da Vasari), 3 dall’in- 
glese, 3 dal tedesco, 2 dal francese, 1 dal latino. 

Dei 171 testi tecnici/dizionari 142 sono testi classificabili come “Tecnico - Arte”, 20 come 
“Tecnico - Architettura”, 8 come “Tecnico - Storia”, 1 come “Dizionario - Monolingue”. 

+ Dei 77 testi non tecnici 52 sono classificabili come “Letterario – Biografico”, 16 come 
“Letterario – Fiction”, 8 come “Letterario – Saggistica”, 1 come “Divulgativo - Guida”. 
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3. Uso del corpus LBC russo 


Come già detto, i partecipanti al progetto si sono prefissi un obiettivo am- 
bizioso: creare una risorsa di riferimento multilingue autorevole che presen- 
ti il vocabolario е le combinazioni fisse relative al patrimonio culturale della 
città di Firenze; una risorsa che includa sia termini di arte, storia dell’arte, re- 
ligione, storia, sia i nomi propri, inomi comuni e i toponimi usati per descri- 
vere quel patrimonio culturale. Larealizzazione delportale coinvolge non solo 
studiosi e docenti universitari, ma anche gli studenti, per i quali rappresenta 
un’ottima scuola di metodo nell'ambito della lessicologia, della lessicografia e 
dell’ortografia della lingua russa, nonché una pratica insostituibile nell’ambi- 
to della traduzione. 

A chi é rivolto il progetto? Innanzitutto ai lavoratori dei musei, alle organiz- 
zazioni turistiche e ai traduttori, ovvero agli specialisti che quotidianamente 
affrontano la necessità di compilare, utilizzare, tradurre guide e cataloghi di 
mostre. Ma si rivolge anche a una рїй ampia gamma di utenti interessati sia alle 
attrazioni turistiche che alla storia dell'arte e della religione. E stato appunto l'o- 
rientamento su un farget cosi ampio che ha predeterminato la scelta delle fonti 
perla formazione della banca dati, di cui si é già detto nel precedente paragrafo. 

Cosa distingue questo progetto da portali simili già esistenti (Wikipedia, en- 
ciclopedie, dizionari speciali e bilingue)? La banca dati è limitata al vocabolario 
relativo al patrimonio culturale di una città, intesa come prototipo di città d'arte, 
ma essa viene ampliata attirando ulteriore materiale fattuale (antroponimi, nomi 
di istituzioni e monumenti, toponimi), andando a confluire in un'unica risorsa. 
Ma la cosa più importante è che ogni unità lessicale acquisisce un polifonismo 
di suono e di significato, in quanto è accompagnata non solo da una traduzione 
estesa e raffinata, ma anche da esempi di utilizzo memorizzati nella banca dati. 

Non è un caso che il centro di questa iniziativa sia stata Firenze: la città in 
cui tutta l’arte europea non solo ha preso forma e si è sviluppata fino alla sua 
massima realizzazione, ma ha trovato anche una comprensione teorica, riflessa 
nell'opera fondamentale del fiorentino Vasari. Pertanto, è ovvio che la lingua 
italiana in questo progetto sia il punto di partenza (Figura 1). 
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Lanini Ludovica (dir), Corpus LBC-IT (2018), Firenze University 
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Figura 1. Pagina iniziale dei Corpora. 
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Naturalmente, ciascuna di queste lingue ha un suo complesso rapporto con 
il donatore italiano. Ci concentreremo sulla componente russa del progetto, 
che ha le sue specificità. Oltre ai problemi legati all'accuratezza della traduzio- 
ne di alcune unità lessicali, derivanti dalle significative differenze che esisto- 
no, ad esempio, tra le tradizioni ecclesiastiche cattolica e ortodossa, differenze 
che richiedono ulteriori chiarimenti e spiegazioni, ad ogni passo ci si imbatte 
in problemi di traslitterazione e/o trascrizione di nomi propri, nomi comuni e 
toponimi dall'alfabeto latino al cirillico. 

Daremo solo due esempi di asimmetria semantica a proposito di due parole 
chesiincontrano immediatamente nel momento in cuisifala conoscenza anche 
superficiale di una città europea o russa. Stiamo parlando dell'«altare» (altar") 
e della «cattedrale» (sobor). 

Se ci affidiamo solo al dizionario bilingue russo-italiano, altar’ viene tradot- 
to come altare e si ritiene che queste unità lessicali descrivano la stessa parte 
dell'interno della chiesa. Ma questa é una somiglianza 'apparente' e uno spe- 
cialista capisce subito che si parla di cose diverse. L’altare é presente sia nella 
chiesa cattolica che in quella ortodossa, ma la loro posizione e funzione sono 
diverse. L'«altare» (altar’) della chiesa ortodossa in realtà corrisponde al presbi- 
terio italiano; mentrel'«altare» della chiesa cattolica corrisponde al russo «tro- 
no» (prestol), alla «tavola peri sacrifici» (stol dlja Zertvoprinosenija, Zertvennik). 

La prima cosa che i turisti vedono in qualsiasi città italiana é il Duomo, la 
cattedrale. In russo, la parola sobor si riferisce a una chiesa particolarmente im- 
portante in cui si svolgono celebrazioni delle massime autorità ecclesiastiche, 
ma non possiede uno stato unico, come la cattedrale nella tradizione occiden- 
tale, che é legata alla presenza della cattedra episcopale. Quindi, in una grande 
città come Mosca o San Pietroburgo possono esserci diverse cattedrali. Il tra- 
duttore si trova subito di fronte a un problema: lasciare Іа parola «duomo» nella 
traslitterazione cirillica o dare una traduzione esplicativa: «la principale, la più 
importante cattedrale della città». E poiché non esiste una simile gerarchia lessi- 
cale fissa perla parola «duomo» in russo, essa si trasforma in un nome proprio: 
il Duomo, ovvero la Cattedrale di Santa Maria del Fiore. Molto spesso la parola 
semplicemente non viene usata, sostituita dalla parola sobor”. 

Ilcorpus in corso di implementazione consente di evidenziare tutti i problemi 
sopra citati e molti non ancora citati al fine di attirare l’attenzione degli specia- 
listi alla ricerca di soluzioni e per raggiungere la massima unificazione possibile 
delle strategie di traduzione. 

Per illustrare le possibilità del corpus nell'analisi e nella valutazione delle tra- 
duzioni, consideriamo un piccolo frammento della Vita di Filippo Brunelleschi di 
Vasari, che descrive il disegno della cupola del Duomo di Firenze e i materiali 
da utilizzare nella costruzione, in particolare i diversi tipi di pietra (Tabella 1). 


# Si veda la voce «SANTA-MARIJA-DEL-F’ORE» in Bol'Saja Rossijskaja Enciklopedija 
(BRE), <https://bigenc.ru/fine_art/text/3533826>, (2017), 10/2020. 
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Tabella 1. Frammento dalla Vita di Filippo Brunelleschi di Vasari. 


Originale (1568) 


Traduzione (1933) * 
di A. Gabricevskij 


Traduzione (1963)% 
di A. Venediktove A. 
Gabricevskij 


42 


43 


1. Facciansi poi ventiquat- 
tro sproni con le dette volte 
murati intorno, e sei archi di 
macigni forti e lunghi, bene 
sprangati di ferri, i quali sieno 
stagnati, e sopra detti maci- 
gni, catene di ferro, che cin- 
ghino la detta volta con loro 
sproni. «...» 


2. Il primo e secondo cerchio 
da pié, sia rinforzato per tut- 
to, con macigni lunghi per il 
traverso, si che l'una volta e 
l'altra della cupola si posi in 
sui detti macigni. <...> 


3. Gli sproni murati tutti di 
macigni e di pietra forte, e si- 
milmente le facce della cupo- 
la tutte di pietra forte, legate 
con gli sproni fino all’altezza 
di braccia ventiquattro, e da 
indi in su si muri di mattoni, 
o vero di spugna, secondo che 
si delibererà per chi l’averà a 
fare, più leggieri che egli po- 
trà. <...> 


1.Затемследуетприступить 
K постройке этих двадцати 
четырех ребер вместе с 
заложенными между ними 
сводами, а также шести 
арокизкрепкихидлинных 
известняковых камней, 
прочно скрепленных 
процинкованными 
железными пиронами, 
а поверх этих камней 
наложить железные 
обручи, которые бы 
связывали означенный 
свод сего ребрами. <...> 


2. Первый и второй венец 
снизудолжны быть сплошь 
завязаны поперечной 
кладкой из длинных 
известняковых камней, 
такчтобы оба сводакупола 
на них покоились. <...> 


3. Ребра должны быть 
целиком сложены из 
известняка и прочного 
песчаника, а также и 
самые своды — целиком 
из прочного песчаника, 
причем и ребра и своды 
должны быть связаны 
друг с другом вплоть до 
вышины двадцати четырех 
локтей, откуда уже может 
начаться кладкаизкирпича 
или туфа, в зависимости 
от решения того, кому это 
будет поручено, так чтобы 
это было как можно легче. 


1.Затем следуетприступить 
к постройке этих двадцати 
четырех ребер вместе с 
заложенными между 
ними сводами, а также 
шести арок из крепких и 
Алинных кусков мачиньо, 
прочно скрепленных 
процинкованными 
железными пиронами, 
а поверх этих камней 
наложить железные 
обручи, которые бы 
связывали означенный 
свод сего ребрами. <...> 


2. Первый и второй венец 
снизу должны быть сплошь 
завязаны поперечной 
кладкой из длинных 
известняковых камней 
так, чтобы обасводакупола 
на них покоились. <...> 


3. Ребра должны быть 
целиком сложены из 
мачиньо и пьетрафорте, 
а также и самые грани 
целиком из пьетрафорте, 
причем и ребра, и своды 
должны быть связаны 
друг с другом вплоть AO 
вышины двадцати четырех 
локтей, откуда уже может 
начинаться кладка из 
кирпича или туфа в 
зависимости от решения 
того, кому это будет 
поручено, так, чтобы это 
было, как можно легче. <...> 


Diiordzio Vazari, Zizn' Filippo Brunellesko, florentijskogo skul'ptora i architektora, in 14., 
Zizneopisanija naibolee znamenitych Zivopisce,; vajatelej i zodcich, t. 2, Moskva-Leningrad, 
Akademija 1933, p. 283 (trad. di A. Gabriéevskij); accessibile alla pagina web: <http:// 


www.vostlit.info/Texts/rus17/Vazari 2/framevvedl.htm». 


Diiordzio Vazari, Žizn’ Filippe Brunellesko florentijskogo skul’ptora i architektora, in Id., 
Žizneopisanija naibolee znamenitych živopiscev, vajatelej i zodčich, t. 2, Moskva-Leningrad, 
Akademija 1963, (trad. di A. Venediktov e A. Gabričevskij); accessibile alla pagina web: 
<http://www.vostlit.info/Texts/rus17/Vazari_3/frametext11.htm>. 
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4. L'acque della cupola termi- 
nino in su una ratta di marmo 
larga un terzo, e getti l'acqua 
dove di pietra forte sarà mu- 
rato sotto la ratta ... 


4. <...> вода C купола 
должна будет попадать 
на мраморный желоб, 
шириной в одну треть 
локтя, который будет 
выбрасывать воду туда, где 
внизу желоб будет сложен 


4. Вода с купола будет 
попадать на мраморный 
желоб шириной в одну 
треть локтя, который будет 
выбрасывать воду туда, где 
внизу желоб будет сложен 
из песчаника. 


из песчаника. 


Come si può vedere dai testi sopra citati, essi abbondano di dettagli tecnici е 
spiegazioni complesse che richiedono non solo il possesso di una terminologia 
linguistica appropriata, ma anche la comprensione delle caratteristiche ingegne- 
ristiche dell'oggetto in costruzione. Quanto ai nomi delle pietre, in questo brano 
di Vasari, oltre al marmo, troviamo altri tre tipi di minerali: macigno, pietrafor- 
te, spugna. I traduttori hanno dovuto affrontare un compito difficile: trovare un 
equivalente sufficientemente vicino per un lettore non esperto di mineralogia 
(1.1933), oppure lasciare il nome italiano, spiegando nel testo che si tratta ap- 
punto di una pietra (1.1963). 

Gabritevskij, l'autore della traduzione del 1933, traduce costantemente 
«macigno» con izvestnjakovyj kamen' («pietra calcarea») e «pietraforte» con 
pescanik («arenaria»); ma nella traduzione del 1963, dove egli agisce sia come 
traduttore che come editore, l'impostazione cambia: «macigno» viene traslit- 
terato come macin’o (1. 1963), oppure tradotto, come nella versione precedente, 
con izvestnjakovyj kamen’ (2.. 1963). Il lettore ne ricava l'impressione che si trat- 
ti di due minerali completamente diversi. Lo stesso approccio ambiguo viene 
offerto nella versione del 1963 per la traduzione di «pietraforte»: la traslittera- 
zione p'etraforte (3. 1963) o la traduzione con pescanik (4. 1963, 3-4. 1933). È 
difficile trovare una spiegazione logica per questa duplicazione di termini vista 
l'assenza di spiegazioni nel testo. 

Va detto che la traduzione del 1933 é incompleta: in essa manca, oltre al- 
le biografie degli artisti meno famosi, anche la parte introduttiva, la parte piü 
‘tecnica’ dell'opera vasariana, dedicata a questioni generali di pittura, scultura 
e architettura. Nella traduzione iniziata nel 1956 il primo volume“ contiene 
questa parte introduttiva, che presenta una grande quantità di terminologia 
specifica, ivi inclusi termini tratti dalla mineralogia, nella misura in cui que- 
sta parte della scienza della natura era nota al Vasari al momento della stesura 
della sua opera. A. Venediktov, il traduttore del volume, ha lasciato quasi sem- 
pre i nomi italiani dei minerali, dando il prestito in uso o una traslitterazione 
in russo (Tabella 2). 

Se guardiamo al numero di menzioni di «macigno» nel corpus italiano (Fi- 
gura 2), possiamo vedere che questa parola ricorre 38 volte in Vasari. Nel corpus 


^ Dziordzio Vazari, O razliénych kamnjach, sluzasich architektoram dlja ukrasenij i skul'pto- 


ram dlja statuj, in Id., Zizneopisanija naibolee znamenitych Zivopiscev, vajatelej i zod£ich, t. 
1, Moskva, Iskusstvo 1956, (trad. di A. Venediktov); accessibile alla pagina web: «http:// 
www.vostlit.info/Texts/rus17/Vazari 2/framevvedl.htm». 
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Tabella 2. Tabella delle pietre citate nell’Introduzione di Vasari. 


Vasari 1568 Вазари 1956 (traduzione di A. Venediktov) 
porfido порфир 

serpentino серпентин 

cipollaccio чиполаччо 

mischio MHCKHO 

granito гранит 

(pietra di) paragone Парагон (Nome comune - пробирный камень) 


Marmo (diversi colori) 
Specie dimarmi: 


мрамор (разных цветов) 
сорта мрамора: 


cipollini YHIIOAAHHO 
saligni салиньо 
campanini кампанино 
mischiati мискиато 
рописе пемза 
Trevertino / travertino травертин 


Piperno / preperigno Пиперино / препериньо (Nome comune attuale - пеперин) 
pietra da calcina известняк 

Pietra serena пьетрасерена 

macigno мачиньо 

Pietra forte пьетрафорте 


russo lo troviamo solo 13 volte (Figura 3), di cui due ripetute nella traduzione 
del 2011. Negli altri contesti il termine «macigno» è reso, come abbiamo det- 
to, con il russo izvestnjakovyj kamen’. 

La «pietra arenaria», che non era menzionata nell’Introduzione, ricorre nel 
corpus italiano 6 volte (nei testi su Michelangelo e Brunelleschi), il «calcare» 
2 volte ela «pietra calcarea» 4 volte. Descrivendo i diversi tipi di minerali uti- 
lizzati nell'edilizia, nell'architettura e nella scultura, Vasari si é affidato alla loro 
descrizione visiva piuttosto che alla composizione chimica, che oggi viene uti- 
lizzata dagli specialisti in mineralogia e petrografia. Tuttavia, la maggior parte 
dei nomi che egli usa si sono conservati nell’italiano*°. La sfida per i traduttori 


5 Questa traduzione è un altro mistero, legato però non all'opera di Vasari, ma solo alla pratica 


editoriale. Il testo, pubblicato nel 2011 e annunciato come nuova traduzione, é in realtà una ri- 

produzione quasi esatta della traduzione pubblicata dalla casa editrice Iskusstvo nel 1956-71. Per 

quale ragione M. Globacev sia indicato come autore di questa traduzione, resta da indovinare. 
16 Nel Vocabolario Treccani troviamo la seguente definizione di «macigno»: «roccia sedimen- 
taria, arenaria del periodo cretaceo o del paleogene, a grana media o fina, a cemento calcareo 
o calcareo-argilloso, di colore da grigio a grigio-giallastro o grigio-azzurrognolo, facilmente 
disgregabile per gelivazione, molto diffusa nell'Appennino, usata come materiale da costru- 
zione e per macine da mulino. Viene detto pietra forte se compatto e resistente, pietra morta se 
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Query macigno 38 (32.27 per million) €) 


Page i Jof? co [Nen] Last 


doc#15 ё copioso di sassi e per tutto pieno di cave di macigni , che son lavorati dí continovo da scarpellini e 
doc#38 egli era conoscere, fu una Nunziata di pietra di macigno , che in Santa Croce di Fiorenza fu posta all’ 
docf38 di granito, è di mano di Donato una Dovizia di macigno forte tutta isolata, tanto ben fatta che dag’ 
u ) guaste; e arco, per mettere una porta di macigno moderna, fu rovinato, e per fare ancora con I 
assai, comeché non avesse il suo fínimento di macigni se non poi l' anno 1330. «/p»«p» Dopo ciò fu fondata col 
pei l'arche e sepolture che vi erano di marmo e dí macigno , e metterne parte dietro al campanile, nella 
doc#201 di fuori di detto S. Giovanni, levandone | macigni che prima erano fra que’ marmi antichi. Volendo 
doc#202 ricoperti da altri molti e grandi ornamenti di macigno , che in quel luogo, col disegno di Giorgio 
doc#213 che vi sono, vi si vede un arco di macigno che regge una cortina di marmo aggruppata, 
doci213 netta che fra il blanco del marmo et il bigio del macigno ella pare molto più simile al vero panno che al 
d0c#219 una ghirlanda di rosoni intagliati di macigno che sportano Infuorl un braccio e un terzo, 
doc#228 con le dette volte murati intorno, e sel archi di macigni forti e lunghi, bene sprangati di ferri, i quali 
doc#228 di ferri, i quali sieno stagnati; e sopra detti macigni catene di ferro che cinghino la detta volta con 
doc#228 cerchio da piè sia rinforzato per tutto con macigni lunghi per il traverso, si che l” una volta e l' 
doc#228 volta e l'altra della cupola si posi in sui detti macigni . E nella altezza @ ogni braccia IX delle dette 
doc#228 — l amor delle salite. GU sproni murati tutti di macigni e di pietra forte, e similmente le facce della 
doc#228 di Filippo, sopra alcuni pilastri acanalati di macigno . Era una quaresima in S. Spirito di Fiorenza 
doc#243 ; et oltre all’ altre cose, la porta che fece di macigno , la quale va di chiesa ai detti luoghi, fu in que" 
doc#246 dal ghiaccio; si come è ancora un San Luca di macigno , stato fatto dal medesimo mentre era 
doc#254 — fare un camino di spesa grandissima, tutto di macigno , intagliato da Benedetto da Rovezzano, che fu 


Page fi lof? оо Next | Last 


"m m 
TERTI 


Figura 2. Risultati della ricerca del termine «macigno» nel corpus italiano. 


Query мачиньо 13 (7.89 per million) € 


doct (а место это скалистое и полное залежей мачиньо , постоянно обрабатываемых каменотесами и 
doc#é5 __ поназваниюпьетрасерена и серый, именуемый мачиньо , а также пьетрафорте, широко применяемый в 
doci72 каким он был на самом деле, было Благовещение из мачиньо , находящееся во Флоренции, в церкви Санта 
doc#73 многими другими крупными украшениями из мачиньо , выполненными там в 1535 году по рисунку 
doc#93 была разрушена, когда пробивали новые двери из мачиньо и строили на вклады названного братства 


полог, 
doc#105 благодаря сочетанию белого мрамора и серого мачиньо полог более напоминает настоящую ткань, чем. 
doc#113 гирлянды, состоящей из розеток, высеченных из мачиньо и выступающих на локоть с третью, так что 
docW207 … a также шести арок из крепних и длинных кусков мачиньо , прочно скрепленных процинкованныни 
docK207 лестницы. Ребра должны быть целиком сложены из мачиньо и пьетрафорте, а также и самые грани целиком из 
doc#211 (а место это скалистое и полное залежей мачиньо , постоянно обрабатываемых каменотесами и 


Figura 3. Risultati della гїсегса del termine «macigno» nel corpus russo. 


era quella di mantenere un equilibrio tra la fedeltà all'originale e l'intelligibi- 
lità e l'accessibilità del testo nella lingua di ricezione. In questa situazione, la 
spiegazione che la "pietra serena" e la "pietra forte" sono tipi di arenaria di una 
certa tonalità permetterebbe non solo agli specialisti, ma anche agli amatori di 
comprendere meglio il testo di Vasari. Pertanto, il termine macin'o avrebbe do- 
vuto essere spiegato, almeno nell'Introduzione sulle pietre, dicendo che si tratta 
di una pietra calcarea. Dal nostro punto di vista, é stato un errore usare paral- 
lelamente il prestito dall'italiano e il termine russo izvestnjakovyj kamen' senza 
operare una netta distinzione. 


friabile, pietra serena se di colore azzurrognolo e ben lavorabile» («https: //www.treccani.it/ 
vocabolario/macigno/>, 11/2020). Questa definizione moderna é pienamente coerente con la 
traduzione di Gabricevskij 1933, che traduce «macigno» come izvestnjakovyj kamen’, е «pie- 
tra forte» come proényj pescanik (ringrazio la collega M. Perotto peril prezioso suggerimento). 
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Questo & solo un esempio delle innumerevoli sfide che gli storici dell’arte, 
gliinterpreti, le guide turistiche e gliamanti dell’arte devono affrontare quando 
sirivolgono a un'opera complessa come quella di Vasari. Ovviamente l'opera di 
Vasari necessita di una nuova traduzione, che tenga conto delle nuove conoscen- 
ze, dei nuovi approcci e delle nuove tecniche di traduzione, e per essa il corpus 
proposto sarebbe un ausilio essenziale. 

Cosiil progetto, che si era posto l'obiettivo di riportare la lingua italiana al suo 
legittimo posto di intermediario e donatore nel dialogo tra le culture, ha avuto 
come logica continuazione l’obiettivo di colmare le lacune, rivedere e chiarire 
molti fenomeni linguistici nelle versioni delle singole lingue nazionali, incluso 
il russo. Lavorare con un corpus parallelo ci permetterä di penetrare nell’arte e 
nella tecnica della traduzione e di seguire sul piano diacronico come sono cam- 
biati gli approcci e i metodi della pratica traduttiva. 
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